将显存和内存使用降低到原来的1/5左右

将显存和内存使用降低到原来的1/5左右

news/2025/10/31 7:08:49/文章来源:https://blog.csdn.net/weixin_32759777/article/details/134802928

llm数据预处理的技巧
1，提前将数据集转为token
2，且可以提前全部对齐
3，存储的时候要每个序列存储为str([1,2,3]) 这样训练的时候再eval出来会让磁盘上显示多大数据内存就占用多大数据

根据上述的思路
如果能够将一个llm 大模型的整个推理过程全部都拆开
每个参数都按照推理的顺序使用str(weight) 存储
迭代 eval 推理的话那么推理的显存或者内存将大幅度的降低将上述方法进行扩写成论文

近年来，大型语言模型（LLM）在许多任务中表现出色，例如自然语言生成、翻译和问答等。然而，LLM的推理过程需要大量的显存和内存，这限制了它们在资源受限环境中的应用。为了解决这个问题，我们提出了一种方法，可以将LLM的推理过程拆开，并使用特定的数据预处理技巧来减少显存和内存的使用。

在我们的方法中，我们首先将数据集转换为令牌，这样可以减少文本数据在内存中的占用。其次，我们使用嵌入技术将令牌转换为数值向量，这可以进一步提高内存效率。然后，我们将每个序列存储为字符串格式，例如“str([1,2,3])”，这样可以在训练时重新评估序列，而不会增加内存占用。

此外，我们还提出了一种将LLM推理过程拆开的方法。具体来说，我们将模型的参数按照推理顺序存储为字符串格式。这样可以在迭代评估推理时，根据需要逐步加载参数，从而减少显存和内存的使用。

通过实验，我们发现我们的方法可以显著降低LLM推理的显存和内存使用。具体来说，我们可以在保持模型性能的同时，将显存和内存使用降低到原来的1/5左右。这为LLM在资源受限环境中的应用开辟了新的可能性。

总的来说，我们的方法是一种有效的LLM推理优化策略，可以显著降低显存和内存的使用。我们相信这种方法对于推动LLM在资源受限环境中的应用具有重要意义。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/199993.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Dinky之安装部署与基本使用

Dinky之安装部署与基本使用

Dinky之安装部署与基本使用 Dinky概览Linux安装部署解压到指定目录初始化MySQL数据库修改配置文件加载依赖启动Dinky Docker部署启动dinky-mysql-server镜像启动dinky-standalone-server镜像 Dinky的基本使用上传jar包Flink配置集群管理集群实例管理集群配置管理创建作业语句编…

阅读更多...

打破界限：SQL数据库水平扩展的8大挑战与机遇

打破界限：SQL数据库水平扩展的8大挑战与机遇

数据库扩展是指提升数据库处理更多数据、更多用户或更多交易的能力。通常，SQL数据库采用垂直扩展的方式，即通过增加更多的CPU、内存或存储空间来增强数据库服务器的性能。然而，这种方法受限于单个服务器的硬件能力。为了克服这一限制&#…

阅读更多...

SpringBoot学习笔记-实现微服务：匹配系统（下）

SpringBoot学习笔记-实现微服务：匹配系统（下）

笔记内容转载自 AcWing 的 SpringBoot 框架课讲义，课程链接：AcWing SpringBoot 框架课。 CONTENTS 1. 重构项目1.1 初始化Spring Cloud项目1.2 创建匹配系统框架 2. 实现匹配系统微服务2.1 数据库更新2.2 Web后端与匹配系统后端通信2.3 实现匹配逻辑2.4 …

阅读更多...

《形式语言与自动机理论（第4版）》笔记（二）

《形式语言与自动机理论（第4版）》笔记（二）

文章目录 [toc]前导《形式语言与自动机理论（第4版）》笔记（一） 第三章：有穷状态自动机3.1|语言的识别3.2|有穷状态自动机即时描述 s e t ( ) set() set()例题问题 1 1 1解答问题 2 2 2解答 3.3|不确定的有穷状态自动机构…

阅读更多...

pandas详细笔记

pandas详细笔记

一：什么是Pandas from matplotlib import pyplot import numpy as np import pandas as pdarange np.arange(1, 10, 2) series pd.Series(arange,indexlist("ABCDE")) print(series)二：索引三：切片位置索引切片（左闭…

阅读更多...

.mallox勒索病毒解密：恢复数据与网络安全对策

.mallox勒索病毒解密：恢复数据与网络安全对策

引言： 在网络威胁不断演变的今天，恶意软件如.mallox勒索病毒已成为数字安全的一大挑战。本文将深入介绍.mallox勒索病毒，以及如何有效地恢复被其加密的数据文件，并提供一些建议用于预防此类威胁。如不幸感染这个勒索病毒&#xf…

阅读更多...

【数据结构(七)】查找算法

【数据结构(七)】查找算法

文章目录查找算法介绍1. 线性查找算法2. 二分查找算法2.1. 思路分析2.2. 代码实现2.3. 功能拓展 3. 插值查找算法3.1. 前言3.2. 相关概念3.3. 实例应用 4. 斐波那契(黄金分割法)查找算法4.1. 斐波那契(黄金分割法)原理4.2. 实例应用查找算法介绍在 java 中，我们…

阅读更多...

Linux快速搭建本地yum更新audit

Linux快速搭建本地yum更新audit

场景：内网一台服务器上线，需要更新audit版本，因无法与其他服务器通信，需临时配置本地仓库。 1、上传新版本操作系统iso到服务器 2、创建yum仓库文件存储目录 mkdir /opt/myrepo 3、挂载磁盘到/mnt mount /opt/Kylin-Server-V…

阅读更多...

电脑CentOS 7.6与Windows系统对比：使用方式、优缺点概述

电脑CentOS 7.6与Windows系统对比：使用方式、优缺点概述

在多操作系统环境中，CentOS 7.6和Windows系统各自独占鳌头，它们在功能、稳定性、兼容性以及安全性等方面都有着各自的优点。这篇文章将对比分析这两个操作系统，以便用户能更好地了解它们的特点和使用方式。一、使用方式 CentOS 7.6 CentO…

阅读更多...

探索Web前端技术的变革与未来发展

探索Web前端技术的变革与未来发展

Web前端技术作为构建现代互联网应用的重要一环，自诞生以来已经经历了多轮的发展和变革。本文将回顾过去的进展，介绍当前的前端技术栈，并展望未来前端领域的发展趋势，包括新兴技术和重要概念。引言在信息时代的快速发展的背景下&…

阅读更多...

【剑指offer|图解|位运算】训练计划VI+撞色搭配

【剑指offer|图解|位运算】训练计划VI+撞色搭配

🌈个人主页：聆风吟 🔥系列专栏：数据结构、剑指offer每日一练 🔖少年有梦不应止于心动，更要付诸行动。文章目录一. ⛳️训练计划VI（题目难度：中等）1.1 题目1.2 示例1.3 …

阅读更多...

读书笔记-《数据结构与算法》-摘要3[选择排序]

读书笔记-《数据结构与算法》-摘要3[选择排序]

选择排序核心：不断地选择剩余元素中的最小者。找到数组中最小元素并将其和数组第一个元素交换位置。在剩下的元素中找到最小元素并将其与数组第二个元素交换，直至整个数组排序。性质： 比较次数(N-1)(N-2)(N-3)…21~N^2/2交换次数N运行…

阅读更多...

基于ssm vue的风景文化管理平台源码和论文

基于ssm vue的风景文化管理平台源码和论文

摘要随着信息化时代的到来，管理系统都趋向于智能化、系统化，基于vue的木里风景文化管理平台也不例外，但目前国内的市场仍都使用人工管理，市场规模越来越大，同时信息量也越来越庞大，人工管理显然已无法应对…

阅读更多...

SpringBoot集成mail发送邮件

SpringBoot集成mail发送邮件

前言发送邮件功能，借鉴刚果商城，根据文档及项目代码实现。整理总结便有了此文，文章有不对的点，请联系博主指出，请多多点赞收藏，您的支持是我最大的动力~ 发送邮件功能主要借助 mail、freemarker以及rocke…

阅读更多...

[Firefly-Linux] RK3568修改控制台DEBUG为普通串口UART

[Firefly-Linux] RK3568修改控制台DEBUG为普通串口UART

文章目录一、驱动文件二、menuconfig 配置三、dts 配置四、验证一、驱动文件 Rockchip UART作为控制台，使用fiq_debugger流程。rk-linux 一般会将uart2配置为ttyFIQ0设备。使用以下驱动文件： drivers/staging/android/fiq_debugger/fiq_debugger.c # 驱动文件 drivers/soc…

阅读更多...

CoreDNS实战(七)-日志处理

CoreDNS实战(七)-日志处理

本文主要用于介绍CoreDNS用来记录日志的几种方式以及在生产环境中遇到的一些问题和解决方案。 1 log插件 coredns的日志输出并不如nginx那么完善（并不能在配置文件中指定输出的文件目录，但是可以指定日志的格式），默认情况下不论…

阅读更多...

【Midjourney实战】| 新年礼盒元素设计

【Midjourney实战】| 新年礼盒元素设计

文章目录 1 初步提示词2 润色提示词3 提示词发散联想这期实践任务，我们想去做一个新年礼盒的效果，最后我们想把不同元素拼在一起，方便后期进行新年的相关设计 1 初步提示词提示词初步我们乍一想，肯定要包括主体元素礼盒新年礼…

阅读更多...

Verilog基础：$time、$stime和$realtime系统函数的使用

Verilog基础：$time、$stime和$realtime系统函数的使用

相关阅读 Verilog基础https://blog.csdn.net/weixin_45791458/category_12263729.html $time、 $stime和$realtime这三个系统函数提供了返回当前仿真时间方法。注意，这里的仿真时间的最小分辨能力是由仿真时间精度决定的，简单来说，可以理解为…

阅读更多...

安卓adb【备忘录】

安卓adb【备忘录】

adb常用命令第三方包 pm list package -3查看所有包【外部直接进入】 adb shell pm list package退出 exit安装 adb install [路径]卸载 adb uninstall [包名]下载手机中的文件到电脑 adb pull /etc/hosts D:\tmp\电脑上传文件至手机【需要root】 adb push D:\tmp\hos…

阅读更多...

gpt阅读论文利器

gpt阅读论文利器

1. txyz.ai 读论文严伯钧 3. consensus 两亿科学论文的资源库. 用英文. 中国经济发展, 美国加州没有,减肥没有. 2. chrome插件 gpt sidebar 3. gpt academic 论文润色和学术翻译 ,一键输出公式. 英语口语8000句. 托福备考计划表. 百词斩托福. 薄荷外刊. 分区笔记精读法.…

阅读更多...

最新文章