上下文微调(Contextual Fine-Tuning, CFT)提高大型语言模型(LLMs)在特定领域的学习和推理能力

大型语言模型(LLMs)在开放领域任务中表现出色,但在快速演变的专业领域(如医学、金融)中面临挑战:

  • 知识更新难题:传统指令微调(Instruction Fine-Tuning, IFT)依赖显式指令,难以适应动态知识。
  • 灾难性遗忘:持续预训练(Continued Pretraining, CPT)可能导致模型遗忘已有知识。
  • 推理能力限制:模型难以通过纯文本学习建立领域内深层语义关联。

本文提出上下文微调(Contextual Fine-Tuning, CFT),通过模拟人类认知策略的提示语,结合上下文学习和微调的方法,通过简单的领域自适应提示显著提高了LLMs在新领域的知识获取和开放式推理能力。实验结果表明,CFT在医疗和金融领域的基准测试中均优于传统的持续预训练和指令微调方法。
CFT在处理领域特定数据时的具体优势:

提高学习效率:CFT通过上下文提示提供额外的语义信息,帮助模型更好地理解和学习新领域的知识,从而提高了学习效率。实验表明,CFT模型在训练过程中损失更低,收敛速度更快。

增强模型性能:CFT在多个医疗和财务基准测试中均表现出优于CPT和IFT的性能。例如,在医疗领域的多选题数据集中,CFT的平均准确率提高了4.89%。

减少遗忘:CFT通过结合上下文学习和微调,能够在学习新领域知识的同时保留已有的知识,减少了知识遗忘的现象。这与传统的持续预训练方法相比具有显著优势。

适用性广泛:CFT不仅适用于生物医学领域,还可以扩展到其他领域,如金融、法律等,显示出其广泛的适用性和灵活性。


方法创新:上下文微调(CFT)

核心思想

  • 认知策略驱动:设计受教育学理论启发的上下文提示(如“关注核心概念”“批判性分析”),引导模型学习新知识时的语义理解。
  • 梯度对齐:通过提示语控制模型优化方向,减少无效参数更新,缓解遗忘问题。

技术实现

  1. 输入构造
    在原始输入序列前添加上下文提示语,例如:
    "Critically analyze the upcoming information. Look for underlying assumptions..."
    形成新输入:[提示语] + [原始文本]

通过指导GPT-4o-mini根据每个训练批次的内容创建提示来自动生成上下文提示。
具体来说,我们使用以下指令模板:在这里插入图片描述在此模板中,{{ INSTRUCTION }}被替换为从以下五种不同指令中抽取的一个样本指令,以生成多种提示:

  1. “给定以下文本,生成一个鼓励读者关注所呈现的主要观点和主题的上下文提示。该上下文提示应简洁并帮助读者深入参与内容。”
  2. “分析下面的文本,并创建一个引导读者批判性地思考内容的上下文提示,质疑假设并评估论点。”提示应鼓励读者考虑文中提出的不同观点。
  3. “阅读文本,并生成一个情境提示,鼓励读者思考信息如何与他们现有的知识或经验相联系。提示应促进新见解与先前理解的整合。”
  4. “阅读以下文本,并创建一个情境提示,引导读者用自己的话总结主要观点。提示应鼓励综合信息以便更好地理解。”
  5. “根据下面的文本,制定一个情境提示,引导读者比较和对比所介绍的概念与相关话题或先前知识。提示应帮助识别相似之处和差异。”

同样,{{ TEXT }} 会被每批的文本替换。
以下是适用于 OpenMedText 的生成的上下文提示示例:

  1. “对这项关于 PCR 技术和 LeHV-5 检测的研究中的方法和发现进行批判性评估。实验设计的基础假设是什么?是否有其他方法或观点可以挑战或补充所提出的论点?考虑这些方法对更广泛的兽医医学科学研究和诊断的影响。”
  2. “思考钾离子通道与癌症治疗中的化疗耐药性之间的复杂关系。所呈现的机制与你之前对癌细胞生物学和耐药性的了解有何比较?确定不同类型癌症中 K+通道的作用的异同及其对治疗策略的影响。考虑将这种理解纳入临床实践的潜在途径。”
  3. “从多个角度考虑学校早餐参与情况的发现及其对学生健康的影响。教育工作者、政策制定者、学校管理人员和医疗保健专业人员可能如何不同地解释这些结果?思考每个利益相关者如何在其各自的角色中使用这些信息来改善学生健康和教育成果。”
  1. 训练目标
    损失函数定义为:
    L C F T ( θ ) = − E x , c ∑ k = 1 n log ⁡ P θ ( x k ∣ c , x < k ) \mathcal{L}_{CFT}(\theta) = -\mathbb{E}_{x,c} \sum_{k=1}^n \log P_\theta(x_k | c, x_{<k}) LCFT(θ)=Ex,ck=1nlogPθ(xkc,x

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/72101.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在 LaTeX 中强制表格位于页面顶部

在 LaTeX 中强制表格位于页面顶部&#xff0c;可以通过以下 多种方法结合使用&#xff0c;按优先级推荐&#xff1a; 方法 1&#xff1a;使用 [!t] 位置限定符 原理&#xff1a;通过 [!t] 强制 LaTeX 优先将表格放置在页面顶部&#xff08;Top&#xff09;&#xff0c;! 表示忽…

kotlin与MVVM的结合使用总结(二)

在 MVVM&#xff08;Model - View - ViewModel&#xff09;架构中&#xff0c;M 层即 Model 层&#xff0c;主要负责数据的管理、存储和获取&#xff0c;它与业务逻辑和数据处理相关。在 Kotlin 中实现 MVVM 的 M 层&#xff0c;通常会涉及数据类的定义、数据的本地存储与远程获…

电子元器件选型与实战应用—16 怎么选一个合适的MCU芯片?

文章目录 1. 选型要素1.1 价格1.2 技术支持1.3 厂家优势1.4 功耗1.5 特殊功能1.6 统计外设1.7 确定外设占用的内存和flash大小1.8 确定外设通信接口1.9 确定外设通信接口的电平1.10 确定外设的GPIO数量1.11 确定外设的供电和功耗1.12 确定外设GPIO的种类1.13 确定ADC的数量1.14…

VSCode 搭建C++编程环境 2025新版图文安装教程(100%搭建成功,VSCode安装+C++环境搭建+运行测试+背景图设置)

名人说&#xff1a;博观而约取&#xff0c;厚积而薄发。——苏轼《稼说送张琥》 创作者&#xff1a;Code_流苏(CSDN)&#xff08;一个喜欢古诗词和编程的Coder&#x1f60a;&#xff09; 目录 一、VScode下载及安装二、安装 MinGW-w64 工具链三、Windows环境变量配置四、检查 M…

Django系列教程(7)——路由配置URLConf

目录 URLconf是如何工作的? path和re_path方法 更多URL配置示例 URL的命名及reverse()方法 使用命名URL 硬编码URL - 不建议 URL指向基于类的视图(View) 通过URL传递额外的参数 小结 Django的项目文件夹和每个应用(app)目录下都有urls.py文件&#xff0c;它们构成了D…

transformer bert 多头自注意力

输入的&#xff08;a1,a2,a3,a4&#xff09;是最终嵌入&#xff0c;是一个(512,768)的矩阵&#xff1b;而a1是一个token&#xff0c;尺寸是768 a1通过wq权重矩阵&#xff0c;经过全连接变换得到查询向量q1&#xff1b;a2通过Wk权重矩阵得到键向量k2&#xff1b;q和k点乘就是值…

Spring Boot + MyBatis-Plus 项目目录结构

以下是一个标准的 Spring Boot MyBatis-Plus 项目目录结构及文件命名规范&#xff0c;包含每个目录和文件的作用说明&#xff0c;适用于中大型项目开发&#xff1a; 项目根目录结构 src/ ├── main/ │ ├── java/ # Java 源代码 │ │ └── com/…

Webpack优化前端性能

Webpack优化前端性能☆☆ 涵盖了代码分割、懒加载、压缩、缓存优化、Tree Shaking、图片优化、CDN使用等多个方面。 Webpack优化前端性能详解(2025综合实践版) Webpack作为现代前端工程化的核心工具,其优化能力直接影响项目的首屏速度、交互流畅度和用户体验。以下从代码维…

ardunio R4 WiFi连接实战

ardunio WiFi连接模板 ardunio R4 WiFi 开发板有着不错的性能和板载内存&#xff0c;本机自带 WiFi 连接模块&#xff0c;可以完成简单的网络服务。对于这个小东西我情有独钟&#xff0c;也总希望能够用它来做些什么&#xff0c;所以先从 WiFi 连接开始学起&#xff0c;未来考…

C++11 编译使用 aws-cpp-sdk

一、对sdk的编译前准备 1、软件需求 此文档针对于在Linux系统上使用源码进行编译开发操作系统使用原生的contos7Linux。机器配置建议 内存8G以上,CPU 4个 以上GCC 4.9.0 及以上版本Cmake 3.12以上 3.21以下apt install libcurl-devel openssl-devel libuuid-devel pulseaudio-…

得物 Android Crash 治理实践

一、前言 通过修复历史遗留的Crash漏报问题&#xff08;包括端侧SDK采集的兼容性优化及Crash平台的数据消费机制完善&#xff09;&#xff0c;得物Android端的Crash监控体系得到显著增强&#xff0c;使得历史Crash数据的完整捕获能力得到系统性改善&#xff0c;相应Crash指标也…

SpringBoot3+Lombok如何配置logback输出日志到文件

Background/Requirement SpringBoot3Lombok如何配置logback输出日志到文件&#xff0c;因为我需要对这些日志进行输出&#xff0c;控制台输出和文件输出&#xff0c;文件输出是为了更好的作为AuditLog且支持滚动式备份&#xff0c;每天一个文件。 Technical Solution 1.确保你…

主流向量数据库对比

在 AI 的 RAG&#xff08;检索增强生成&#xff09;研发领域&#xff0c;向量数据库是存储和查询向量嵌入的核心工具&#xff0c;用于支持高效的语义搜索和信息检索。向量嵌入是文本或其他非结构化数据的数值表示&#xff0c;RAG 系统通过这些嵌入从知识库中检索相关信息&#…

搞定python之四----函数、lambda和模块

本文是《搞定python》系列专栏的第四篇&#xff0c;通过代码演示列python自定义函数、lambda和模块的用法。本文学习完成后&#xff0c;python的基础知识就完了。后面会学习面向对象的内容。 1、自定义函数 # 测试python自定义函数# 有参数&#xff0c;没有返回值 def say_he…

[操作系统] 学校课程关于“静态优先级抢占式调度“作业

今天我们来分享两道题目哈, 学校弄得题目. T1: 静态优先级, 抢占式(1为高优先级) 图解: 以下是静态优先级抢占式调度的解题过程和结果&#xff1a; 解题思路&#xff1a; 优先级规则&#xff1a; 数值越小优先级越高。新进程到达时&#xff0c;若其优先级高于当前运行进程&…

洛谷P1320 压缩技术(续集版)

P1320 压缩技术&#xff08;续集版&#xff09; 题目描述 设某汉字由 N N N \times N NN 的 0 \texttt 0 0 和 1 \texttt 1 1 的点阵图案组成。 我们依照以下规则生成压缩码。连续一组数值&#xff1a;从汉字点阵图案的第一行第一个符号开始计算&#xff0c;按书写顺序从…

使用DeepSeek完成一个简单嵌入式开发

开启DeepSeek对话 请帮我使用Altium Designer设计原理图、PCB&#xff0c;使用keil完成代码编写&#xff1b;要求&#xff1a;使用stm32F103RCT6为主控芯片&#xff0c;控制3个流水灯的原理图 这里需要注意&#xff0c;每次DeepSeek的回答都不太一样。 DeepSeek回答 以下是使…

volatile、synchronized和Lock

名词解释&#xff1a; 指令重排是计算机为了优化执行效率&#xff0c;在不改变单线程程序结果的前提下&#xff0c;对代码的执行顺序进行重新排列的操作。它可能发生在编译阶段&#xff08;编译器优化&#xff09;或CPU运行阶段&#xff08;处理器优化&#xff09;。 举个栗子…

嵌入式八股C语言---面向对象篇

面向对象与面向过程 面向过程 就是把整个业务逻辑分成多个步骤,每步或每一个功能都可以使用一个函数来实现面向对象 对象是类的实例化,此时一个类就内部有属性和相应的方法 封装 在C语言里实现封装就是实现一个结构体,里面包括的成员变量和函数指针,然后在构造函数中,为结构体…

Distilling the Knowledge in a Neural Network知识蒸馏

一.知识蒸馏的定义 1. 量化VS蒸馏 量化&#xff1a;减小精度 例如参数float32—>float16蒸馏&#xff1a;Student model模仿Teacher model,在保持较高性能的同时&#xff0c;减少模型大小和计算复杂度的技术。 二.知识蒸馏步骤 1.教师模型训练: 训练一个大型且复杂的神…