【大模型】【扫盲】几种不同的微调方法

【大模型】【扫盲】几种不同的微调方法

news/2025/10/20 20:34:23/文章来源:https://www.cnblogs.com/satsuki26681534/p/19153594

四种微调方式

Full

对预训练模型的所有参数进行微调，让模型从底层到顶层的所有参数都参与更新，彻底适配下游任务

优点：模型对任务的适配性最强，在数据充足、任务复杂时效果通常最优
缺点：资源消耗极大（千亿参数模型需高端 GPU 集群，训练时长以天 / 周计）；数据量不足时极易过拟合（模型死记训练数据，泛化能力差）

适用于数据量大，复杂度高，计算资源充足的情景

Freeze

仅微调模型的部分参数（通常是 “顶层” 或新增的任务专属层，如分类头、输出层），冻结大部分底层参数（保留预训练阶段学到的通用知识）
适用于数据量少，任务简单，计算资源有限的场景

LoRA Low-Rank Adaptation

不直接修改预训练模型的原始参数，而是在模型的关键层（如注意力层、前馈网络层）插入低秩矩阵对（可理解为 “小配件”），仅微调这组低秩矩阵，原始模型参数保持冻结

在微调过程中，原始参数全程不更新

优点：训练速度极快、显存消耗极低；效果接近全量微调，且能完美保留原模型知识；支持多任务共享大模型
缺点：
若任务需要 “深度改造” 模型（如极小众领域的知识注入），低秩矩阵可能无法完全捕捉复杂规律，效果略逊于全量微调；
依赖 “低秩假设”，若任务与预训练任务差异过大，适配性会下降

适用于纯文本的任务，多任务场景，边缘设备部署等场景

QLoRA（Quantized LoRA，量化低秩适应）

是 LoRA 的升级版：先对预训练模型进行量化压缩（如 4 位量化，将浮点数参数转为低精度整数），再在量化后的模型上应用 LoRA 方法，仅微调新增的低秩矩阵

适合用在资源极其紧张的场景

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/941573.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Tuack 生成比赛题目 PDF 笔记

Tuack 生成比赛题目 PDF 笔记

Part 1. Tuack 的基本介绍 Tuack，是一个由来自 THU 的大佬 Mulab11 开发的，用于造算法竞赛题目的工具。你可以用它：导出 PDF、Markdown、HTML 等多种不同格式，NOI、CPC 等不同风格的题面。简单的出题人自评测功能…

阅读更多...

在 wrapper 类里实现重载方法

在 wrapper 类里实现重载方法

现有包装类 Wrapper 欲覆盖 inner 的方法 g class A{void f(){g();}void g(){} }class Wrapper extends A{A inner;void f(){inner.f() // 不调用 Wrapper.g}void g(){ // override g} }inner 通过 this.g 调用时仍然会…

阅读更多...

Vue 项目 AI 文档增量更新工具操作手册

Vue 项目 AI 文档增量更新工具操作手册

一、工具目标通过 AI 自动生成 Vue 组件 / JS 工具的工程化解释文档，并支持增量更新（仅处理新增 / 修改的文件），避免重复劳动，提升团队文档效率。二、环境准备前置条件已初始化的 Vue 项目（Vue 2 或 Vue 3 均…

阅读更多...

P7521 [省选联考 2021 B 卷] 取模分析

P7521 [省选联考 2021 B 卷] 取模分析

题目概述给你 \(n\) 个数 \(a_i\)。求：\(\max_{i\ne j\ne k}(a_i+a_j)\bmod a_k\)。分析好题！我一开始看到是无从下手的。但是细想一下，关键点在于 \(a_k\)，所以的说，枚举 \(a_k\) 是必不可少的。然后我们…

阅读更多...

4060显卡也能玩转AI改图！Flux.1 Kontext Dev GGUF版本超详细入门教程 - 实践

4060显卡也能玩转AI改图！Flux.1 Kontext Dev GGUF版本超详细入门教程 - 实践

4060显卡也能玩转AI改图！Flux.1 Kontext Dev GGUF版本超详细入门教程 - 实践pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-fam…

阅读更多...

提升生产力：8个.NET开源且功能强大的快速开发框架

提升生产力：8个.NET开源且功能强大的快速开发框架

提升生产力：8个.NET开源且功能强大的快速开发框架今天大姚给大家分享8个.NET开源、免费、功能强大的快速开发框架。助你提高开发生产效率、避免996！！！ Vue.NetCore 一款基于Vue（提供Vue2/Vue3版本）和.Net Core前…

阅读更多...

Mac版PDF Squeezer v4.5.1安装教程（DMG文件下载+详细步骤）

Mac版PDF Squeezer v4.5.1安装教程（DMG文件下载+详细步骤）

Mac版PDF Squeezer v4.5.1安装教程（DMG文件下载+详细步骤）PDF Squeezer 是一款 Mac 专用的 PDF 压缩工具，可以快速减小 PDF 文件大小，同时尽量保持文件清晰度，适合邮件发送、云端存储或节省空间…

阅读更多...

使用c++14标准实现函数注册包装

使用c++14标准实现函数注册包装

调用方式bool res = FunctionRegistry::callFromFuncMap1<bool, type1&, type2*, type3,... >(...)，其中第一个bool为返回值类型，第二个开始后面均为参数列表类型，可用于注册算子，包装函数指针等。 #inc…

阅读更多...

【VSCode中Java创建环境安装的三个层级之Maven篇】（Windows版）

【VSCode中Java创建环境安装的三个层级之Maven篇】（Windows版）

【VSCode中Java创建环境安装的三个层级之Maven篇】（Windows版）2025-10-20 20:15 tlnshuju 阅读(0) 评论(0) 收藏举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !imp…

阅读更多...

详细揭秘：马拉车算法

详细揭秘：马拉车算法

马拉马拉车拉马拉马

阅读更多...

黑马程序员Java基础笔记

黑马程序员Java基础笔记

目录类执行顺序继承方法重写构造器多态抽象类接口枚举类字符串内部类匿名内部类拆箱与装箱克隆浅克隆：深克隆：正则表达式Lambda方法引用静态方法引用实例方法引用特定类型方法引用构造器引用泛型通配符集合Collectio…

阅读更多...

实用指南：linux磁盘空间爆满排查与清理

实用指南：linux磁盘空间爆满排查与清理

实用指南：linux磁盘空间爆满排查与清理pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Mo…

阅读更多...

实用指南：socketpair深度解析：Linux中的“对讲机“创建器

实用指南：socketpair深度解析：Linux中的“对讲机“创建器

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

阅读更多...

详细介绍：从零开始的C++学习生活 2:类和对象(上)

详细介绍：从零开始的C++学习生活 2:类和对象(上)

详细介绍：从零开始的C++学习生活 2:类和对象(上)pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas",…

阅读更多...

【aigc】chrome-devtools-mcp怎么玩？ - 指南

【aigc】chrome-devtools-mcp怎么玩？ - 指南

【aigc】chrome-devtools-mcp怎么玩？ - 指南2025-10-20 20:02 tlnshuju 阅读(0) 评论(0) 收藏举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: b…

阅读更多...

2025年不锈钢酸洗钝化液厂家推荐排行榜，环保型不锈钢管酸洗钝化液，不锈钢清洗钝化液，酸洗钝化处理工艺及不锈钢清洗剂公司推荐

2025年不锈钢酸洗钝化液厂家推荐排行榜，环保型不锈钢管酸洗钝化液，不锈钢清洗钝化液，酸洗钝化处理工艺及不锈钢清洗剂公司推荐

2025年不锈钢酸洗钝化液厂家推荐排行榜：环保型不锈钢管酸洗钝化液技术解析与选购指南行业背景与发展趋势不锈钢材料因其优异的耐腐蚀性和美观性，在石油化工、食品医药、建筑装饰等领域得到广泛应用。随着环保政策的…

阅读更多...

记账：流水报表

记账：流水报表

流水报表展示收入、支出、转账的流水条数，可用于判断记账的活跃状况（用处不大，由于只需在现有的设计上改动少许即可，因此顺手做了）查询流水报表：底部ledgers直接输入4（3表示出入报表），分组等其他条件可选下面…

阅读更多...

2025年法兰保护罩厂家推荐排行榜，阀门保温罩，法兰罩，法兰防溅罩，法兰保护套，专业防护与定制服务优质供应商

2025年法兰保护罩厂家推荐排行榜，阀门保温罩，法兰罩，法兰防溅罩，法兰保护套，专业防护与定制服务优质供应商

2025年法兰保护罩厂家推荐排行榜：专业防护与定制服务优质供应商深度解析在工业防护领域，法兰保护罩、阀门保温罩、法兰罩、法兰防溅罩、法兰保护套等产品已成为现代工业安全防护体系不可或缺的重要组成部分。随着工…

阅读更多...

英伟达微型AI工作站的架构解析与性能突破

英伟达微型AI工作站的架构解析与性能突破

本文深入解析英伟达最新发布的DGX Spark微型AI工作站技术架构，包括GB10芯片设计、内存带宽优化、高速网络互联等关键技术特性，以及其在AI推理和模型训练方面的实际应用表现。英伟达微型Grace-Blackwell工作站正式上市…

阅读更多...

百度网盘非会员下载慢怎么解决 - fosgrignonhto

百度网盘非会员下载慢怎么解决 - fosgrignonhto

今天教大家一下这个百度网盘非会员下载慢怎么解决，之前，我也是被这个速度所无语，根本下不动，后面没办法了。只能上一些工具啥的，真让我找到一个方法。地址获取：放在这里了，可以直接获取这就是我测试的速度，还是…

阅读更多...

最新文章