基于Qwen1.5-0.5B指令监督微调数据集的模型训练

1、安装 LLaMA Factory
输出:检查LLaMA Factory版本,日志或截图。
在这里插入图片描述

2、更新数据集
输出:样本数据集(zh.test.csv)处理后形成微调训练格式的json文件,部分数据或截图。
<数据集>
在这里插入图片描述

在这里插入图片描述

dataset_info.json文件指定
在这里插入图片描述

(1)格式转换,将原始数据集csv文件转换为Alpaca格式的json串,且符合LLamaFactory的指令监督微调数据集并且支持大模型Qwen1.5-0.5B训练,格式转换要求,将text列的文本内容转换为json文件的“人类输入”input字段的值,将label:LABEL列类型转换为json文件的“模型回答”output字段的值,json文件的指令instruction的值为“对文本进行分类”
在这里插入图片描述
(2)数据清洗:去除空格、无效符号、对文本类型重新分类
去除空格:


在这里插入图片描述
在这里插入图片描述

重新分类:
在这里插入图片描述

3、使用命令行或WebUI微调模型
输出:微调命令或WebUI执行完成后日志或截图。
<base模型>
chinese-bert-wwm或qwen2.5_0.5b

本地使用从魔塔社区下载的Qwen1.5-0.5B模型

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

训练完成截图

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

4、模型推理
输出:用微调后模型推理输出三条样本数据的结果,输出结果与样本数据集中分类一致,日志或截图。

选择训练后的模型,选择其中0324的版本进行验证
在这里插入图片描述

使用input对模型进行提问:

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

通过以上问答结果可以看出,指令监督微调训练成功了。

学习总结(非AI生成):

问题1:数据集应该怎样准备?
实践过程:本次demo实施指令监督微调,选用alpaca的数据集格式
{
“instruction”: “对文本进行分类”,
“input”: “漳州华安离婚财产分割法律知识”,
“output”: “租赁法律”
}
由于训练一直达不到预期效果,对数据进行重新清洗,将所有特殊的符号和空格进行整理,然后重新分类,分类时遇到一个问题,有很多文本的内容是摸棱两可的类型,所以在python生成脚本时,指定了按照文本包含的字段进行分类,比如包含’农产品’, ‘批发市场’, '蔬菜’的文本分类农业等,然后将能够分类的文本提取4000多条进行训练。

问题2:大模型应该怎么选型?那种模型适配本机设备Gtx1060显卡的显存
实践过程:最开始下载的模型为Qwen1.5-7B,由于体量太大电脑显存无法流畅的运行,换成Qwen1.5-0.5的模型进行训练,Qwen1.5-7B虽然精度较高显存占用为28G,但是对于Gtx1060属于超符合运行,如果不是开启4方量化,估计很难跑起来,于是选择了显存只占2G的Qwen1.5-0.5,虽然能力没有7B强,优势是可以在显存更小的机器上训练,并且能够满足文本分类指令微调的这种小demo。

问题3:大模型训练
实践过程:
对页面各种参数进行微调、调优
最开始使用500条、1000条、5000天等数据进行训练,学习轮次为1轮,学习率5e-5,批量8,梯度2,开启混合精度fp16,使用lora微调

后续优化:核心参数(学习轮次:10,验证集:0.2)

问题4:对“训练后”的大模型进行验证,始终没有实现预期效果
排查过程:
由于验证无效,之后更改了近10次配置后进行训练,一直无法让模型根据json文本的output进行输出,最终查阅相关资料解决,这里有一个致命的点就是过于依赖ai的问题排查思路,
出现了问题后直接抛给ai,由于ai并未回答出训练无效的真正问题点,以至于后续排查脱离问题点,时间浪费巨大,所以在之后的学习和工作中一定不能过度依赖ai。
这个问题我的最终解决的办法是在llamafactory的webui界面的检查点路径设置上选择执行后的模型进行测试,发现大模型能够按照数据集提供的output进行输出,对于指令监督微调的理解我的个人理解是:在AI模型问答上给定语言标记来触发指定答案进行输出。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/906579.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JVM梳理(逻辑清晰)

JVM总览 JVM 是什么&#xff0c;作用是什么 JVM&#xff08;Java Virtual Machine&#xff0c;Java 虚拟机&#xff09;是一个可以运行 Java 字节码的虚拟计算机 核心作用&#xff1a;实现跨平台&#xff08;“一次编写&#xff0c;到处运行”&#xff09;&#xff0c;JVM 是…

【typenum】 9 与常量泛型桥接(generic_const_mappings.rs)

一、源码 该代码提供了常量结构体与库类型的转换。 // THIS IS GENERATED CODE //! Module with some const-generics-friendly definitions, to help bridge the gap //! between those and typenum types. //! //! - It requires the const-generics crate feature to be…

SOPHGO算能科技BM1688内存使用与编解码开发指南

1. BM1688内存分配接口详解 1.1 设备内存分配接口区别 BM1688提供了三个主要的设备内存分配接口,它们的主要区别如下: // 基本设备内存分配接口 void* bm_malloc_device_byte(bm_handle_t handle, unsigned int size);// 指定heap区域的设备内存分配 void*</

解决软件连接RabbitMQ突发System.IO.IOException: 无法从传输连接中读取数据: 远程主机强迫关闭了一个现有的连接异常

一、问题描述 系统再运行时&#xff0c;突然出现 System.Exception: [RabbitMQ.Send Error] RabbitMQ.Client.Exceptions.AlreadyClosedException: Already closed: The AMQP operation was interrupted: AMQP close-reason, initiated by Library, code541, text“Unexpected…

STM32单片机GUI系统1 GUI基本内容

目录 一、GUI简介 1、emWin 2、LVGL (Light and Versatile Graphics Library) 3、TouchGFX 4、Qt for Embedded 5、特性对比总结 二、LVGL移植要求 三、优化LVGL运行效果方法 四、LVGL系统文件 一、GUI简介 在嵌入式系统中&#xff0c;emWin、LVGL、TouchGFX 和 Qt 是…

基于vue框架的动漫论坛g2392(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。

系统程序文件列表 项目功能&#xff1a;用户 开题报告内容 基于Vue框架的动漫论坛开题报告 一、研究背景与意义 &#xff08;一&#xff09;研究背景 随着互联网技术的飞速发展&#xff0c;动漫文化在全球范围内迅速传播&#xff0c;成为连接各国青年的重要文化纽带。动漫…

网络安全管理之钓鱼演练应急预案

文章目录 网络安全管理之钓鱼演练应急预案前言一、背景和目的1.1背景1.2目的 二、整体思路三、演练所需四、风险评估和演练目标4.1 风险评估4.2 演练目标 五、演练计划5.1 演练时间和地点5.2 参与人员5.3 演练场景5.4 演练流程5.5 演练评估 六、 应急响应流程七、钓鱼邮件防范7…

Hooks实现原理与自定义Hooks

React Hooks 是 React 16.8 引入的一种机制&#xff0c;允许在函数组件中使用状态&#xff08;state&#xff09;、副作用&#xff08;effect&#xff09;等功能&#xff0c;而无需编写 class 组件。其核心原理是通过闭包和链表结构&#xff0c;在 React 的 Fiber 架构中管理组…

单片机设计_四轴飞行器(STM32)

四轴飞行器&#xff08;STM32&#xff09; 想要更多项目私wo!!! 一、系统简介 四轴飞行器是一种通过四个旋翼产生的升力实现飞行的无人机&#xff0c;其核心控制原理基于欧拉角动力学模型。四轴飞行器通过改变四个电机的转速来实现六自由度控制&#xff08;前后、左右、上下…

服务器的基础知识

什么是服务器 配置牛、运行稳、价格感人的高级计算机&#xff0c;家用电脑不能比拟的。 服务器的组成&#xff1a;电源、raid卡、网卡、内存、cpu、主板、风扇、硬盘。 服务器的分类 按计算能力分类 超级计算机 小型机AIX x86服务器&#xff08;服务器cpu架构&#xff09; …

单目测距和双目测距 bev 3D车道线

单目视觉测距原理 单目视觉测距有两种方式。 第一种&#xff0c;是通过深度神经网络来预测深度&#xff0c;这需要大量的训练数据。训练后的单目视觉摄像头可以认识道路上最典型的参与者——人、汽车、卡车、摩托车&#xff0c;或是其他障碍物&#xff08;雪糕桶之类&#xf…

C语言链表的操作

初学 初学C语言时&#xff0c;对于链表节点的定义一般是这样的&#xff1a; typedef struct node {int data;struct node *next; } Node; 向链表中添加节点&#xff1a; void addNode(Node **head, int data) {Node *newNode (Node*)malloc(sizeof(Node));newNode->dat…

STM32 OTA 中断向量表重定向

在STM32的OTA&#xff08;Over-the-Air&#xff09;升级中&#xff0c;​中断向量表重定向是关键技术需求&#xff0c;其核心原因在于STM32的硬件架构和固件运行机制。以下从原理、实现方式及必要性三个角度详细分析&#xff1a; 一、中断向量表的作用与默认机制 ​中断向量表的…

Win11上安装docker

Win11上安装docker 一、安装WSL&#xff08;Windows Subsystem for Linux&#xff09;二、安装docker到D盘三、启动docker四、测试启动容器 一、安装WSL&#xff08;Windows Subsystem for Linux&#xff09; 以管理员身份打开cmd 更新WSL wsl --update3. 安装WSL wsl --ins…

Vue3+ElementPlus 开箱即用后台管理系统,支持白天黑夜主题切换,通用管理组件,

Vue3ElementPlus后台管理系统&#xff0c;支持白天黑夜主题切换&#xff0c;专为教育管理场景设计。主要功能包括用户管理&#xff08;管理员、教师、学生&#xff09;、课件资源管理&#xff08;课件列表、下载中心&#xff09;和数据统计&#xff08;使用情况、教学效率等&am…

java云原生实战之graalvm 环境安装

windows环境安装 在Windows环境下安装GraalVM并启用原生镜像功能时&#xff0c;需要Visual Studio的组件支持。具体要点如下&#xff1a; 核心依赖&#xff1a; 需要安装Visual Studio 2022或更新版本&#xff0c;并确保勾选以下组件&#xff1a; "使用C的桌面开发"…

Flask-SQLAlchemy_数据库配置

1、基本概念&#xff08;SQLAlchemy与Flask-SQLAlchemy&#xff09; SQLAlchemy 是 Python 生态中最具影响力的 ORM&#xff08;对象关系映射&#xff09;库&#xff0c;其设计理念强调 “框架无关性”&#xff0c;支持在各类 Python 项目中独立使用&#xff0c;包括 Flask、D…

MySQL高可用架构:复制与集群实战指南

引言 各位数据库爱好者们好&#xff01;今天我们要深入探讨MySQL高可用架构的核心技术——复制与集群 &#x1f3d7;️。在现代互联网应用中&#xff0c;数据库的高可用性就像建筑物的抗震设计一样重要&#xff0c;直接决定了系统的稳定性和可靠性。本教程将从主从复制原理讲起…

【物联网】基于树莓派的物联网开发【6】——汉化+字体库输入法安装

树莓派系统默认是英文&#xff0c;面向智能设备控制终端或物联网开发场景&#xff0c;需支持中文日志显示与本地化交互。 系统汉化 &#xff08;1&#xff09;输入命令sudo raspi-config,然后选择 Localisation 回车 &#xff08;2&#xff09;选择 locale 回车 &#xff0…

python新手学习笔记①

本笔记是根据Bilibili里的【3小时超快速入门Python | 动画教学【2025新版】【自学Python教程】【零基础Python】【计算机二级Python】【Python期末速成】】 https://www.bilibili.com/video/BV1Jgf6YvE8e/这个视频合集制作的代码笔记&#xff01; 1.字符串连接 运行结果 2.…