CBT-LLM 心理大模型微调,用 LLaMA Factory 微调框架就够啦!| 附一键复现指南

news/2025/11/12 15:35:28/文章来源:https://www.cnblogs.com/lab4ai/p/19214262

图片1.png

01 | 引入

在人工智能快速发展的今天,通用大语言模型虽然具备强大的语言理解和生成能力,但在专业领域服务时往往显得力不从心。以心理健康支持为例,普通预训练模型无法理解"共情"深层含义,难以给出符合认知行为疗法(CBT)原则的专业建议,导致回答要么过于机械,要么缺乏针对性。

仅靠通用模型无法实现"懂情感、会共情"的高质量心理支持,必须通过高质量数据集微调才能实现专业场景的精准适配,将通用语言能力转化为专业领域知识。而LLaMA Factory作为当前最高效微调框架之一,为这一过程提供了重要支持。

02 | LLaMA-Factory 微调在论文中的体现

  • 论文: CBT-LLM: A Chinese Large Language Model for Cognitive Behavioral Therapy-based Mental Health Question Answering
  • 会议: COLING 2024
    链接: [2403.16008] CBT-LLM: A Chinese Large Language Model for Cognitive Behavioral Therapy-based Mental Health Question Answering
  • Hugging Face 链接: Hongbin37/CBT-LLM · Hugging Face
  • 👉 Lab4AI 论文一键复现: Lab4AI 项目页

这篇发表于2024年计算机语言学顶会LREC-COLING的论文CBT-LLM: A Chinese Large Language Model for Cognitive Behavioral Therapy-based Mental Health Question Answering,通过心理问答数据集PsyQA和CBT提示模板,引导ChatGPT生成CBT向导的回答,构建为CBT QA数据集,并用于微调CBT-LLM。核心目标是结合PsyQA数据集的知识与CBT模板,通过ChatGPT的桥梁作用,构建擅长CBT问答的语言模型。

图片2.png

此研究使用了LLaMA-Factory高效模型训练微调框架,使用了添加系统指令的 CBT QA 数据集,选取了LLaMA-Chinese-7B、Alpaca-Chinese-7B、Qwen-7B、Baichuan-7B 作为基线模型,并使用 BLEU、METEOR、CHRF、BLEURT 评估微调模型的效果。

从数据可见,经 LLaMA-Factory 微调后,各基线模型在心理健康问答任务中均展现出良好性能,其中 Baichuan-7B 在 BLEU、METEOR、CHRF、BLEURT 等指标上表现最优,体现出模型在回答结构完整性上的优势,证明 LLaMA-Factory 的微调能力可有效提升模型对 CBT 框架的贴合度。

图片3.png

经过专业评估人员评估,模型在相关性、CBT 结构符合度及助益性 上均有突出表现。

图片4.png

图片5.png

总的来说,CBT-LLM能够完整执行CBT五步框架,揭示了通过提示词引导模型生成高质量数据集后进行微调以增强模型能力的方法有效性。未来研究团队将继续整合ACT/DBT等其他疗法,并引入多轮对话系统,从而更好地模拟真实心理咨询场景,提升模型与患者交互的真实感与深度,满足多样化的治疗需求。

03 | 一键式复现

为加速研究转化,Lab4ai.cn 提供了基于LLaMA-Factory的CBT-LLM完整可复用方案,无需用户进行复杂的环境配置,即可一键式体验模型复现流程。

Step 1:登录Lab4AI.cn,在“项目复现”中找到“LLaMA Factory 微调能力在心理健康大模型中的应用”

👉 项目复现指路:点击查看项目详情

图片6.png

Step 2:点击“立即体验”,选择 GPU 资源后即可启动

图片7.png

图片8.png

Step 3:进入到 code 文件夹下,打开 Experiment.ipynb 文件

图片9.png

备注:本次使用的数据集为PsyQA 数据集。

  • 将下载后的数据组合每组问答的question和description,结合prompt 整理为CBT prompt。
  • 输入DeepSeek V3 获取回答,完成后将回答整理为alpaca格式。我们已经将该数据放到了 code/data/CBT-train.json。

图片10.png

图片11.png

Step 4:直接执行代码块,微调心理健康大模型

图片12.png

Step 5:推理体验

加载微调后的模型,使用如下代码即可进行交互体验。下图为小编交互结果展示,可以看到使用小编微调后的模型进行对话后,大模型给出了心理健康方面的友好建议。

图片13.png

04 | 不止复现:Lab4AI 能支撑 “从研究到落地”

如果你以为 Lab4AI 只能复现 CBT-LLM,那就太小看它了。对于心理大模型领域的研究者、开发者,它还有更长远的价值:

1.科研党:从 “看论文” 到 “发论文” 的全流程支持

每日更新 Arxiv 上的心理 AI 领域论文,支持翻译、分析,帮你快速跟进前沿;除了 CBT-LLM,还能一键复现其他大模型;若你有自己的数据集,能直接在平台上用 LLaMA Factory 微调,甚至对接投资孵化资源,把科研创意变成落地成果。

2.学习者:边练边学 LLaMA Factory + 心理 AI

如果你想掌握“微调框架 + 垂直领域模型”的技能,Lab4AI 的优势更明显:为了方便大家更系统地掌握微调技能,Lab4AI联合官方开源作者推出《从零开始玩转LLaMA Factory 大模型微调》。早鸟价450元=开源作者亲授+配套300元算力+完课证书+微调手册+答疑社群,带您从理论到实践,一站式掌握大模型定制化的核心技能。

👉 详情请点击:课程介绍页面

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/963487.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微算法科技(NASDAQ MLGO)开发基于优先级的区块链交易打包算法,提高云边协同计算环境下的交易效率

在云边协同计算环境中,区块链技术虽提供了分布式信任机制,但随着交易数量激增,传统交易打包算法难以适应。交易拥堵导致确认延迟,影响系统整体性能。尤其是实时性要求高的应用场景,如工业物联网控制指令交易,迫切…

肇庆化妆品西林瓶灌装线推荐:食品级材质接触部件解析

近年来,随着化妆品行业对产品包装安全性与洁净度要求的持续提升,西林瓶作为高端精华液、安瓶类产品的重要载体,在肇庆及周边区域的应用日益广泛。在此背景下,用于化妆品灌装的西林瓶灌装线设备选型成为企业技术升级…

使用uniapp为微信小程序添加返回拦截(不使用onBackPress

在使用uniapp开发微信小程序时,使用onBackPress不会生效,原因是这个api尚未对微信小程序进行支持,故而采用了page-container的方案来进行解决 1,在根节点下添加page-container组件 <view class="" v-…

2025年深色贝母漆优质厂家权威推荐榜单:粉色贝母漆/贝母漆/珍珠白贝母漆源头厂家精选

在高端装饰与工业涂装领域,深色贝母漆以其独特的珍珠光泽和变幻莫测的干涉效应,正成为设计师与消费者的新宠。 据行业数据显示,全球艺术涂料市场正以 17.6% 的年复合增长率高速扩张,预计2030年市场规模将达532亿元…

kvm虚拟机共享目录

kvm虚拟机共享目录使用 9p virtio 共享目录1. 在宿主机修改虚拟机配置关闭虚拟机,在kvm管理器中,左下角添加硬件-文件系统驱动程序:virtio-9p源路径:/home/xql/share目录路径:share2. 在银河麒麟中加载 9p 模块并…

阿勒泰西林瓶灌装压塞机类型及特点解析

在制药与生物制剂行业中,西林瓶灌装设备的选型直接关系到生产效率、合规性及成本控制。尤其在如阿勒泰这类地处偏远但医药需求持续增长的区域,企业对设备性价比、运维便捷性和本地化服务响应速度的关注度显著提升。根…

etcd 存储上限

最佳实践与监控 推荐配置组合 生产环境建议配置:配额值:物理内存的50%(不超过8GB) 自动压缩:保留24小时数据 快照策略:每小时1次,保留最近5份 关键监控指标 etcd_debugging_mvcc_db_total_size_in_bytes:当前存…

kubectl get events 看到的所有事件(Event 对象)默认都存储在 etcd 里

是的,kubectl get events 看到的所有事件(Event 对象)默认都存储在 etcd 里,具体路径为/registry/events/<namespace>/<event-name>。每个事件以 Protobuf 格式落盘,etcd 键值对方式保存。默认 TTL 1…

基于Centos7.9搭建svn服务端

SVN 的全称为 Subversion,它是一个开源的版本控制系统。本文基于centos7.9完成搭建以及迁移实验@目录开始搭建SVN 迁移 SVN 的全称为 Subversion,它是一个开源的版本控制系统。基本原理 它采用集中式的版本管理方式,…

梯度检查

梯度检查(Gradient Checking)中使用的双边逼近(Two-sided Approximation)方法,也称为中心差分法(Central Difference Method)。梯度检查的目的 在深度学习中,我们使用反向传播算法(Backpropagation)来计算损…

荆门定制西林瓶灌装机费用解析,比标准款贵多少?

在荆门地区,随着生物医药、诊断试剂及营养液等细分行业的快速发展,对西林瓶灌装设备的需求日益增长。然而,不少企业在选购定制化西林瓶灌装机时,常因缺乏专业指导而陷入“参数陷阱”或“功能冗余”误区。据行业调研…

甘孜西林瓶灌装压塞机安装调试指南及周期解析

在甘孜地区,随着制药及生物制剂产业的稳步发展,对西林瓶灌装设备的需求持续增长。用户普遍关心的问题之一是:西林瓶灌装压塞机的安装调试是否由厂家负责?安装周期通常需要多久?针对此类问题,业内通行做法是由设备…

Day19综合案例一

<!DOCTYPE html> <html lang="en"> <head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0">…

P13508 [OOI 2024] Burenka and Pether

对于任意一个点 \(i\),\(i\) 能直接到达的点 \(p\) 需要 \(a_p\ge a_i\),且 \(p\le r_i\),其中 \(r_i\) 是 \(i\) 能到的最后一个 \(<a_i\) 的位置 \(+d\)。\(r_i\) 可以按值域扫描线预处理。 对于 \(a_{v_i}\) …

常见的无状态服务与典型有状态服务

常见的无状态服务与典型有状态服务要区分无状态服务和有状态服务,核心标准是:无状态服务:不存储业务数据,每次请求独立(输入相同则输出相同),可随意扩容 / 迁移,依赖外部存储(如数据库、缓存)保存状态; 有状…

CF1720D2 Xor-Subsequence (hard version)

这个题无论是 D1 还是 D2 都很具有思维含量。 首先考虑 \(a_i \le 200\) 怎么做。 考虑异或有性质 \(|a - b| \le a \oplus b \le a + b\),那么推一下就会知道目前 \(j\) 一定 \(\ge i - 400\),暴力枚举即可。 然后思…

如何实现大模型和本企业内部知识相结合形成一个适合本企业的小模型

将大模型与企业内部知识结合,构建适合本企业的“小模型”或增强型应用,核心目标是让通用大模型具备企业专属的知识、语言风格和业务逻辑,同时避免从零训练大模型的高成本和高门槛。以下是具体实现路径和关键步骤: …

etcd的压缩和碎片整理提升性能

压缩+碎片整理(逐节点执行,先压缩后整理,避免并发)bash 复制for ep in ${ENDPOINTS//,/ }; doecho "==> working on $ep"# 取得当前 revisionREV=$(etcdctl --endpoints=$ep endpoint status --write…

Maven 继承的“隐形杀手”:被你忽略的 relativePath

在日常的 Maven 多模块项目开发中,我们对 <parent> 标签带来的继承便利习以为常。但在这个便利之下,隐藏着一个微小却极易被忽视的配置:<relativePath>。 你是否遇到过这样的“灵异事件”:在 IDEA 中,…

【SPIE出版 | 往届会后3个月完成EI检索】第二届遥感与数字地球国际学术会议 (RSDE 2025)

2025年第二届遥感与数字地球国际学术会议(RSDE 2025)定于2025年11月14-16日在云南大理隆重举行。【高录用稳检索 | 往届会后3个月完成EI检索】 【团队报名享优惠 | 参会方式:口头汇报、海报展示、仅参会】 第二届遥…