大语言模型的后训练与“灾难性遗忘”问题——李宏毅2025大模型第六讲笔记 - 指南

news/2026/1/22 13:41:03/文章来源:https://www.cnblogs.com/yangykaifa/p/19516753

当你看到这样一个新闻:
“A 实验室/公司喜报:A采用某开源基座模型Q,经过后训练得到模型Q',Q'在数学编程领域的得分超过Q。”
请思考这样的模型会有什么问题,Q'真的超过了Q吗?学习本节课,你将得到答案

目录

什么?就是一、后训练(Post-training)

二、后训练的核心挑战——灾难性遗忘

典型案例

三、遗忘的根源

四、解决方案:让AI用自己的话学习

1. 经典经验回放

2. 伪经验回放

3. Self-Output 系列方法

4. 巧妙的解法:过滤高难度Token

五、结论与建议


一、后训练(Post-training)是什么?

后训练目标:将通用的“基础模型”变成特定任务或领域的“专才模型”。(如把Llama后训练后,变成金融、法律领域的专有模型)

后训练仍然沿用现有的模型训练范式:

  1. 预训练式:继续做文字接龙,使用领域文本。
  2. 有监督微调式:使用“指令-回答”对训练。
  3. 强化学习式:借助人类反馈优化模型。

二、后训练的核心挑战——灾难性遗忘

原有的通用知识记忆严重衰退,甚至完全丧失原有能力。就是“手术成功,但病人死亡”——模型学会了特定的新东西,但

典型案例:

1、学中文,忘安全

* 基座模型:LLaMA-2-Chat只用英文回答问题,问它危险问题LLaMA-2会拒绝回答

* 用中文后训练之后:LLaMA-2会用中文回答疑问,但安全对齐被破坏,开始回答危险问题。

2、即使用无害资料微调,模型的安全能力也会下降。[1]

3、专才代价是通才能力下降

* 提升某一能力(如编程),其他能力(如数学、语文)下降。

4、学新模态,忘旧格式

  • 通过后训练,想教纯文本语言模型LLaMA识别语音
  • 第一个Epoch:要求语言模型输出语音的情绪,并要求用json格式输出,模型输出错误的情绪,但是会用json格式输出结果(因为LLaMA知道什么是json)
  • 多轮Epoch后:能输出正确的情绪,但模型忘记了如何输出JSON格式。

三、遗忘的根源

那么为什么模型会发生灾难性遗忘?原因如下

  • 单目标优化:训练只优化新任务,不保护旧知识。
  • 知识覆盖:新任务参数覆盖旧任务参数。
  • 模型大小无关:研究1B-7B参数的模型,大小与遗忘程度无显著相关。而模型学的新知识越多,旧知识就遗忘得越厉害。
  • “学得少,忘得少”。就是LoRA 不能根本解决:只

四、解决方案:让AI用自己的话学习

1. 经典经验回放

  • 在训练新任务时,混入5%旧任务数据,可有效防止遗忘。
  • 问题:商业模型原始训练数据不可获取。

2. 伪经验回放

目前商业开源大模型的训练资料不可取,那就让模型自己生成旧任务数据,作为回放材料。

  • 虽可能有事实错误,但能保留模型风格与知识结构。

3. Self-Output 系列方法

  • Mega-Pie:让模型自问自答,生成SFT数据。
  • Paraphrase答案改写:用模型自己改写后的答案训练。
  • self-output 选择性自我排练:模型答对时,用自己的答案训练;答错时才用人类答案。(这种方式跟RL-based的post-training很像)
  • “说我的语言”:用LLM生成的答案教另一个LLM,比只用人类数据集的效果更好。[2]

4. 巧妙的解法:过滤高难度Token

人类写的数据,总有一些词汇是模型输出的过程中,模型很难学到的(如截图)。那么在训练中忽略模型最难预测的Token,避免强制教学。可提升泛化能力,减少遗忘。[3]

五、结论与建议

  1. 遗忘不可避免:后训练本质是单目标优化,会干扰旧知识。
  2. 安全与通用能力最易丢失。
  3. 最有效策略:让模型用自己的话学习,保持训练目标与自身分布一致。
  4. 警示:看到某个模型说自己通过后训练,某个专项能力吊打xx模型,需要警惕,它可能失去了很多通用能力。

[1]Fine-tuning Aligned Language Models Compromises Safety, Even When Users Do Not Intend To!

[2]I Learn Better If You Speak My Language

[3]https://arxiv.org/abs/2501.14

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1200250.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于PLC的皮带机集成控制系统(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码

基于PLC自动上料控制1plc三节皮带机s7-1200编写, 基于PLC的皮带机集成控制系统(设计源文件万字报告讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码 ,西门子s71200制作西门子1200plc三节皮带机上料系统基于plc三节皮带机自动…

COMSOL三维光子晶体结构设计与能带计算分析

COMSOL三维光子晶体能带计算。打开COMSOL时总感觉像在玩三维积木,只不过这次的积木能控制光路。三维光子晶体能带计算这事儿,说白了就是要在晶格周期里找出光子的活动规律,有点像给光造个迷宫再研究它的逃跑路线。建模第一步先得把晶格结构搭…

ZYNQ MPSOC SD卡启动盘制作

1 烧写文件系统 boot文件夹下的所有文件拷贝到 SD 卡的 FAT32分区. sudo cp -f boot/* /media/ht123/FAT32/ ls /media/ht123/FAT32/sudo tar -xf rootfs/rootfs.tar.gz -C /media/ht123/EXT4/ ls /media/ht123/EXT4/ sync

北京地区top10研究生留学机构精选,无隐形消费服务详解

北京地区top10研究生留学机构精选,无隐形消费服务详解作为一名在北京从事国际教育规划工作超过十年的顾问,我接触过大量计划攻读海外硕士学位的学子及其家庭。许多学生在初步咨询时,普遍存在几个核心困惑:如何从北…

二维数组:矩阵存储与多维数组的内存布局

二维数组:矩阵存储与多维数组的内存布局 在 C 编程中,一维数组适用于存储线性序列数据,而当需要处理表格化、矩阵化数据(如学生成绩表、图像像素矩阵)时,二维数组成为更合适的选择。二维数组本质是“数组的…

福州硕士留学机构哪家强?top10申请成功率高,备受学子青睐

福州硕士留学机构哪家强?top10申请成功率高,备受学子青睐一、福州硕士留学机构如何选择?一份基于数据的参考在搜索引擎中,“福州硕士留学机构哪家强”是本地学子及家长频繁查询的问题。选择一家靠谱的留学服务机构…

学长亲荐9个AI论文工具,助你搞定研究生论文写作!

学长亲荐9个AI论文工具,助你搞定研究生论文写作! AI 工具如何成为论文写作的得力助手 在研究生阶段,论文写作不仅是学术能力的体现,更是一场与时间、压力和复杂流程的较量。随着人工智能技术的不断进步,AI 工具逐渐成…

广州地区top10研究生留学中介解析,性价比高,值得关注

广州地区top10研究生留学中介解析,性价比高,值得关注一、广州学子如何甄别高性价比留学中介?作为从业八年的华南地区国际教育规划师,我常被广州高校的学生及家长问及:面对市场上数量众多的留学服务机构,究竟该如…

字符数组与字符串:C 风格字符串的处理技巧

字符数组与字符串:C 风格字符串的处理技巧 在 C 编程中,字符串的处理有两种主流方式:一种是基于字符数组的C 风格字符串(兼容 C 语言),另一种是 C 标准库提供的 string 类。C 风格字符串作为字符数组的核心…

深圳top10研究生留学机构有哪些?值得信赖的机构揭秘

深圳top10研究生留学机构有哪些?值得信赖的机构揭秘一、深圳有哪些值得信赖的研究生留学机构?在搜索引擎中,许多计划出境深造的研究生同学及家长会频繁查询:“深圳研究生留学机构哪家靠谱?”、“深圳本地有哪些口…

FX3U三边封制袋机程序超音波型前后双伺服送料,模拟量控制变频器给料,所有切刀用的气缸,不是常用制袋机的电机凸轮

FX3U三边封制袋机程序超音波型 前后双伺服送料,模拟量控制变频器给料,所有切刀用的气缸,不是常用制袋机的电机凸轮 威纶通触摸屏加FX3u FX2N-2DA 此款为气缸式的,需要高速电机凸轮的请额外说 程序思路清晰引言 FX3U三边封制袋…

无锡硕士留学机构top10有哪些?权威解析,无隐形消费指南

无锡硕士留学机构top10有哪些?权威解析,无隐形消费指南一、无锡硕士留学机构如何选择?高频问题解答作为从业八年的国际教育规划师,我时常遇到无锡地区学生和家长询问:“本地有哪些值得信赖的硕士留学机构?”以及…

在长沙寻找最好的研究生留学中介?学员满意度高的推荐在这里

在长沙寻找最好的研究生留学中介?学员满意度高的推荐在这里一、在长沙寻找研究生留学中介,哪些机构值得关注?作为从业八年的国际教育规划师,我经常遇到长沙高校学生咨询同一个问题:“本地有哪些靠谱的研究生留学中…

郑州研究生留学中介口碑排名揭晓,无隐形消费成关键选择因素

郑州研究生留学中介口碑排名揭晓,无隐形消费成关键选择因素一、郑州学子如何挑选留学中介?无隐形消费成核心诉求撰写本文时,是2026年1月10日。作为一位从业七年的华中地区研究生申请规划导师,我时常被郑州地区的高…

救命神器2026 TOP10 AI论文软件:本科生毕业论文必备测评

救命神器2026 TOP10 AI论文软件:本科生毕业论文必备测评 2026年AI论文辅助工具测评:如何选出最适合本科生的“救命神器” 随着人工智能技术的不断发展,越来越多的学术写作工具进入高校师生的视野。对于本科生而言,撰写毕业论文不…

科耐仕新材料有限公司:品牌实力、核心产品与服务联系方式全览

在工业防护与节能材料领域,科耐仕(KnightShield) 以其专业的技术实力、可靠的产品品质与全面的服务体系,已成为众多企业信赖的品牌。山东科耐仕新材料有限公司作为一家集研发、生产、销售、施工与售后为一体的综合…

探讨包装类印刷品专业印刷企业,如何选择合适的?

随着包装类印刷品在品牌传播与产品销售中的作用日益凸显,企业如何选择专业可靠的包装类印刷品制作企业,成为影响品牌形象与市场竞争力的关键问题。本文围绕包装类印刷品专业印刷企业哪家好包装类印刷品制造商哪家好包…

基于PHP+MySQL开发组合的一站式跑腿小程序源码系统 带完整的搭建部署教程

温馨提示:文末有资源获取方式随着同城服务行业竞争加剧,跑腿团队需要高效可靠的技术支撑。这款基于PHPMySQL的同城跑腿小程序源码系统,以其全面功能和开源特性,成为商业运营的理想选择。源码获取方式在源码闪购网。全流程业务集成…

2026最新幼升小培训机构TOP5评测!服务深度覆盖锦江区、青羊区、双流区等地,辐射成都本地,优质学校权威榜单发布,科学衔接+习惯养成助力儿童平稳过渡小学.

随着教育理念的不断升级,幼升小阶段的科学衔接成为家长关注的焦点。优质的幼小衔接机构能够帮助儿童在身心准备、生活准备、社会准备和学习准备等方面打下坚实基础。本榜单基于课程体系完整性、师资专业度、教学成果、…

可定制化跑腿小程序源码系统,开源与私有化部署特点

温馨提示:文末有资源获取方式在数字化转型趋势下,跑腿团队寻求灵活可控的技术解决方案。这款基于PHPMySQL的同城跑腿小程序源码系统,以开源可二次开发和私有化部署为核心,为团队提供高度定制化可能。源码获取方式在源码闪购网。开…