网站代运营 如何纳税最简单的网站开发软件

web/2025/10/4 23:48:24/文章来源:
网站代运营 如何纳税,最简单的网站开发软件,wordpress 创建模板,网站后台如何登录XTuner微调LLM课程笔记 一、Finetune简介 1.为什么模型要做微调#xff1f; 现在其实大部分的大模型应该叫做“基座模型”#xff0c;也就是基于普遍性的任务去进行与训练的#xff0c;所以如果想让它落地在特定的下游领域中#xff0c;它的表现必然是不如在领域内训练的模…XTuner微调LLM课程笔记 一、Finetune简介 1.为什么模型要做微调 现在其实大部分的大模型应该叫做“基座模型”也就是基于普遍性的任务去进行与训练的所以如果想让它落地在特定的下游领域中它的表现必然是不如在领域内训练的模型所以现在最好的方式就是对大模型进行一个领域内知识的微调。 比如上一期学生的中医药助手食神等等。 2.一般有两种finetune范式 增量预训练微调增量预训练是一种训练策略它允许模型在已有的知识基础上不断学习和改进。在QLoRA中增量预训练意味着模型会在原始预训练数据的基础上不断添加新的数据并重新进行训练。这样可以不断提高模型的泛化能力使其更好地适应各种任务。 指令微调指令微调则是针对特定任务对模型进行微调的过程。在QLoRA中指令微调基于明确的微调指令对模型进行微调使得模型更加专注于特定任务的实现。 增量预训练单纯拓展知识库对语料进行拟合学习但是你如果问他问题他不一定能回答你而是根据你的问题进行拟合回答哈哈哈哈而指令微调就是通过对话对来进行微调训练的所以你问他问题之后他才能很好的回答你毕竟调教过怎么回 简单来说一个是丢知识拓展知识库一个是用高质量对话和回答数据用于训练特定的任务 下面这图就是表示这两者的区别上面就是单纯预训练模型或者单纯增量预训练的模型的问答下面是指令微调的问答 3.关于数据集的建立处理 这就是标准的格式数据有输入有输出 其实每个基底模型的对话模板都不一样这个要看各个大模型开发单位自己的想法比如LlaMa2和InternLM就不太一样自己可以看到这玩意就是为了让LLM区分出system/User/Assistant 关于system/users/assistant的详细内容详见https://zhuanlan.zhihu.com/p/682606003 这里就简单介绍一下system大部分LLM模型的系统指令System message的权重强化高于人工输入的prompt并在多轮对话中保持稳定您可以使用系统消息来描述助手的个性定义模型应该回答和不应该回答的内容以及定义模型响应的格式。 对话模板的作用其实核心就是为了让模型认识这个数据认识我的输入是什么认识它应该学哪个输出。 这就是指令微调与增量预训练微调的本质区别了增量预训练根本就不区分input和output直接拟合整个增量数据计算整个增量数据的loss所以你问他问题的时候他可能有时候直接就是拟合你的问题这句语料输出一个相似的话而指令微调是input/output对话对进行训练模型只学会output训练时只会对output的数据计算loss这样当模型推理时就能根据input输出符和这个input的output 3.微调方案LoRA和QLoRA介绍 简单来说LORA其实就是通过在大模型原有的linear周围新增几个小的linearAdapter)Adapter的参数量远小于原本的linear这样就能大幅降低计算成本的前提下微调这个大模型。其实就是套了一层壳咯然后再与原模型整合一下不就好了嘿嘿嘿主要还是因为要是对整个模型进行调参参数量太大了成本太高 3.1 Full Finetuning VS LoRA VS QLoRA非常重要 这张图已经挺清晰哈 1.Full Finetuning很显然就是要全部加载base model然后又全部加载参数 然后优化参数 又全部加载/ 2.LoRA就是全部加载base model然后优化的时候只有新加入的Adapter部分更新参数并加载/ 3.QLoRA就更离谱了加载base model的时候直接4bit量化了卧槽 更加小了 然后还是只优化Adapter层的参数 而且优化器还是使用的分页优化器可以在CPU和GPU之间相互转移offload,具体见此文章https://zhuanlan.zhihu.com/p/654356333 二.正式介绍XTuner 1.XTuner的优越性和特点 1.1 XTuner特点 你自己也实战过大概也都知道这玩意的方便性主要就是把模型微调的整个步骤集成为一个个命令而且还自带模型的配置文件自己根据微调范式改改就好还自带优化加速消费级显卡也能干总结一下打包带走开箱即用高效便捷 还不错还不错 1.2 性能对比 这就是说XTuner对模型微调过程中的性能优化和显存优化很好显存占用不多不容易 Out of the memory 1.3 开箱即用一键打包带走 挑选配置文件拷贝配置文件 原来那个配置文件的命名是这个意思吼 模型的基本参数介绍咱已经写在源码注释里啦  访问部署模型与之对话 2. XTuner数据引擎 Xtuner数据引擎自动帮你处理原始语料变成格式化问答对再变成可训练语料用于模型训练 针对不同的base model Xtuner集成了对应的数据处理引擎开发者一键调用就好这样的话大家就可以把精力放在珍贵的原始数据内容的收集上不用花费精力去处理它啦太酷啦太酷啦 这就是那个参数多数据样本拼接充分利用GPU的显存啦 3. XTuner的两个优化技巧Flash Attention和DeepSpeed ZeRo Flash Attention默认开启主要看看DeepSpeed ZeRO:这个的话在实战部分的blog已经详细说明 详见书生·浦语大模型实战训练营第二期第四节--Xtuner微调LLM--notebook-CSDN博客 XTuner直接集成这个优化技巧一键命令开启 酷毙了 原来InternLM2-chat-1.8B也是基于InternLM2-1.8B基础模型微调而来的chat模型哈哈哈哈哈现在可能才知道为什么说大模型一开源就可以开始换汤不换药可以微调建立自己领域的大模型了嘿嘿 三、基于LLaVA方案------微调多模态LLM 1.多模态LLM其实就是解决输入文本/图像的问题咯一个是文本的embedding模型一个是image Projector训练好这两个玩意就能转为模型能识别的向量就可以训练多模态LLM啦 2.训练多模态LLM的方案LLaVA 大佬说不能简单说LLaVA模型就是文本单模态模型LLM训练出来的Image Projector 但是你就大概这样理解就好 原理大致如下图自己看图就能很好理解大概分为两个阶段训练阶段是结合单模态文本LLM和文本图像问答对训练数据进行训练得到“眼睛”image projector拆开细分来看这个具体的流程在后面的一节测试阶段就是将这个眼睛整合到原来的单模态文本LLM就可以变成多模态LLM 3.对比LLaVA和LoRA 对比一下LLaVA和LoRA的基本逻辑其实挺像的都是在已用的LLM基础上用新的数据添加一个小的玩意加上去从而实现额外的功能 LLM套上image projector后装上一双眼睛多模态LLM LLM套上了LoRA后有了一个新的灵魂基于特定领域知识的角色 4.训练Image Projector流程 这个流程就是分为两个阶段嘛增量预训练指令微调 Pretrained: 先就是利用文本单模态LLM引入大量的图像及其简单的图像描述也就是大量的基本知识就是质量不太好而且不是对话数据先预训练一个model Finetuned: 然后再引入高质量的图像复杂对话文本对这个预训练model进行微调成为image projector --------------------------------------------------------------------------------------------------------------------------------- 上面就已经训练完了image projector!!!!!! 然后把这个image projector 整合到原来的模型 就相当于加入了一个能解决图像处理的能力咯adpater)那就变成了多模态LLM 这整个流程叫做LLaVA方案如下图上面这节就是下图左边的LLaVA训练阶段啦 然后这就是这节课的理论笔记了下面的基于XTuner的单模态LLM微调和基于LLaVA的多模态LLM微调实战环节请详见我的下一篇博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/87042.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

长安东莞网站推广php网站开发培训班

有两台电脑,一台笔记本一台台式机,拥有各自拥有鼠标和键盘,但总是需要切换,感觉太麻烦,想找个简单的方式,不需要额外操作就能同时操作这两台电脑。无意间发现了一个微软软件Mouse Without Borders&#xff…

创建网站目录时我们应该吕梁市建设局网站

观察者模式 我们可以比喻观察者模式是一种类似广播的设计模式 介绍 观察者模式:对象之间多对一依赖的一种设计方案,被依赖的对象是Subject,依赖的对象是Observer,Subject通知Observer变化。 代码 说明: WeatherStat…

网站开发公司的log射阳建设网站多少钱

使用Spring Boot微服务搭建框架,在eclipse和Idea下能正常运行,但是在打成jar包部署或者直接使用java -jar命令的时候,提示了xxxxxx.jar中没有主清单属性:D:\hu-git\spring-xxx-xxx\target>java -jar spring-cloud-eureka-0.0.1…

企业官方网站建设国内十大新闻

From: https://www.jianshu.com/p/9c10543420de Moment.js常见用法总结 Moment.js是一个轻量级的JavaScript时间库,它方便了日常开发中对时间的操作,提高了开发效率。 ​ 日常开发中,通常会对时间进行下面这几个操作:比如获取时间…

东莞网站建设+信科网络长沙建一个网站多少钱

背景:今天需要对程序生成的图像进行旋转90度和下采样操作,当然还有改变图像类型的操作,就是把原来.png的图像转换为.jpg的图像,主要是我目前使用libharu库,无法成功从本地加载png图像到pdf中去,不得不使用j…

适应移动端网站模板centos 安装wordpress

git提交-分支开发合并-控制台操作 git的基本概念工作区、暂存区和版本库工作区:就是你在电脑里能看到的目录(隐藏目录 .git不算工作区)。暂存区:英文叫 stage 或 index。一般存放在本地的.git目录下的index 文件(.git/…

上海网站推荐做米业的企业网站

本文通过一张GIF动图来继续聊一下ASP.NET Core的请求处理管道,从管道的配置、构建以及请求处理流程等方面做一下详细的研究。(ASP.NET Core系列目录)一、概述上文说到,请求是经过 Server监听>处理成httpContext>Application…

c 网站开发技术广州 网站 设计

来源:AI科技大本营最近,黎曼猜想有点热。上个月,89 岁的菲尔兹奖与阿贝尔奖双料得主、英国皇家学会院士迈克尔阿蒂亚爵士(Michael Atiyah)刚刚宣布自己证明了黎曼猜想。近日,82 岁的北大教授(已…

网站做全景图芜湖网站建设芜湖

概况 redis是一个开源的内存数据结构存储系统,常用做数据库、缓存和消息代理。默认的端口号为6379 更改redis端口号步骤如下 先停止redis服务 redis-cli shutdowm 打开redis配置文件 在redis安装目录下,即redis.windows.conf文件。 port 6396 然后…

网站建设houxiaoerui设计的发展趋势

介绍 游戏引擎是游戏开发中不可或缺的工具,它为开发者提供了构建游戏世界所需的各种功能和工具。本文将介绍游戏引擎的概念、使用方法以及一个完整的游戏项目示例。 游戏引擎的概念 游戏引擎是一种软件框架,它提供了游戏开发所需的各种功能和工具&…

江苏 江苏省住房和城乡建设厅网站网站程序模板

在咱们日常的数字生活中,模拟器这个词儿你可能不陌生,但它到底能干啥?又有哪些好用的模拟器APP呢? 今天,咱们就来聊聊模拟器的功能,并推荐几款热门的模拟器APP,帮助大家更好地利用这一技术。 …

一般网站建设公司株洲搜索引擎优化

1 认识webSocket WebSocket_ohana!的博客-CSDN博客 一,什么是websocket WebSocket是HTML5下一种新的协议(websocket协议本质上是一个基于tcp的协议)它实现了浏览器与服务器全双工通信,能更好的节省服务器资源和带宽…

山东网站方案对网站建设的调研报告

1. 题目 给定一个整数数组 A&#xff0c;坡是元组 (i, j)&#xff0c;其中 i < j 且 A[i] < A[j]。这样的坡的宽度为 j - i。 找出 A 中的坡的最大宽度&#xff0c;如果不存在&#xff0c;返回 0 。 示例 1&#xff1a; 输入&#xff1a;[6,0,8,2,1,5] 输出&#xff1…

企业网站欣赏郑州企业形象设计黑龙江网站建设seo优化

1、spring的概念apache推出的java企业框架&#xff0c;提供了基于ioc的对象工厂、aop面向切面编程等功能及其他增强功能。当前版本4.xxx&#xff0c;支持注解的配置。 springmvc。2、控制反转(ioc):inversion of control。用来描述框架的重要特征spring针对ioc的具体实现&#…

韩语网站建设苏宁推客如何做网站

整合Spring Boot和Apache Solr进行全文搜索 大家好&#xff0c;我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01; 在现代应用开发中&#xff0c;全文搜索是许多应用不可或缺的功能之…

做网站的服务器cpu异常网站后台管理开发

在现代前端开发中&#xff0c;React 提供了多种方法来组织和管理代码。这些方法包括 API 封装、自定义 Hooks、组件、独立模块和 Context。理解它们的区别和联系&#xff0c;可以帮助我们编写更清晰、更模块化的代码。 1. API 封装 目的&#xff1a;处理与后端服务的通信逻辑…

写作网站排行榜潇朋友免费班级网站建设系统

成人学习一般遵循的规律第一阶段是激发起对过去的经历的回忆&#xff0c;让学习者回头想想自己以前做了些什么&#xff0c;是在什么情况下运用什么方法做的&#xff1b;第二阶段&#xff0c;启发学习者对这些经历进行反思&#xff0c;检讨这些经历的成功与失败之所在&#xff0…

浙江省建设信息港网站网站项目分析怎么做 方法

借助集合框架来实现超市会员管理系统&#xff0c;实现以下功能&#xff1a; 1.开卡 2.积分累计 3.查询剩余积分 4.积分兑换 5.修改密码 6.退出 -------------------------------------------------------------------------------------------------- 展示&#x…

网站建设方案如何写如何写手机app程序

Java8实战-总结11 Lambda表达式方法引用管中窥豹如何构建方法引用 构造函数引用 Lambda表达式 方法引用 方法引用让你可以重复使用现有的方法定义&#xff0c;并像Lambda一样传递它们。在一些情况下&#xff0c;比起使用Lambda表达式&#xff0c;它们似乎更易读&#xff0c;感…