Ascend LlamaFactory微调书生模型

1.环境安装

conda create -y -n llamafactory_lab python=3.10 conda activate llamafactory_lab git clone https://gh.llkk.cc/https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory git checkout v0.9.3 pip install -e ".[torch-npu,metrics]" -i https://pypi.tuna.tsinghua.edu.cn/simple pip install torch==2.6.0 torch-npu==2.6.0 torchvision

2.安装校验

使用以下指令对 LLaMA-Factory × 昇腾的安装进行校验: llamafactory-cli env

3.微调前的原模型效果呈现

安装依赖

pip install transformers==4.47.1 # 环境变量设置单卡GPU export ASCEND_RT_VISIBLE_DEVICES=0 # 启动推理 llamafactory-cli chat --model_name_or_path /share/new_models/internlm3/internlm3-8b-instruct --trust_remote_code True

输出结果:

4.微调书生模型

安装依赖

pip install transformers==4.47.1 pip install huggingface_hub==0.34.0 # 创建工作目录 mkdir /root/llamafactory_workdir

安装数据集

export HF_ENDPOINT=https://hf-mirror.com huggingface-cli download --repo-type dataset --resume-download llamafactory/alpaca_en --local-dir /root/dataset/alpaca_en huggingface-cli download --repo-type dataset --resume-download llamafactory/alpaca_zh --local-dir /root/dataset/alpaca_zh

创建dataset_info.json文件

mkdir /root/llamafactory_workdir/data cd /root/llamafactory_workdir/data touch dataset_info.json

dataset_info.json文件

{ "alpaca_en":{ "file_name": "/root/dataset/alpaca_en/alpaca_data_en_52k.json", "columns": { "prompt": "instruction", "query": "input", "response": "output" } }, "alpaca_zh":{ "file_name": "/root/dataset/alpaca_zh/alpaca_data_zh_51k.json", "columns": { "prompt": "instruction", "query": "input", "response": "output" } } }

Yaml配置文件

cd /root/llamafactory_workdir touch internlm3_lora_sft_ds.yaml

internlm3_lora_sft_ds.yaml文件内容

### model model_name_or_path: /share/new_models/internlm3/internlm3-8b-instruct trust_remote_code: True ### method stage: sft do_train: true finetuning_type: lora lora_target: q_proj,v_proj ### dataset dataset: alpaca_en,alpaca_zh template: intern2 cutoff_len: 1024 max_samples: 1000 overwrite_cache: true preprocessing_num_workers: 16 ### output output_dir: saves/internlm3-8b-instruct/lora/sft logging_steps: 10 save_steps: 500 plot_loss: true overwrite_output_dir: true ### train per_device_train_batch_size: 1 gradient_accumulation_steps: 2 learning_rate: 0.0001 num_train_epochs: 3.0 lr_scheduler_type: cosine warmup_ratio: 0.1 fp16: true ### eval val_size: 0.1 per_device_eval_batch_size: 1 eval_strategy: steps eval_steps: 500

开启微调dong

torchrun --nproc_per_node 1 \ --nnodes 1 \ --node_rank 0 \ --master_addr 127.0.0.1 \ --master_port 7007 \ /root/LLaMA-Factory/src/train.py internlm3_lora_sft_ds.yaml

动态合并LoRA的微调

llamafactory-cli chat --model_name_or_path /share/new_models/internlm3/internlm3-8b-instruct \ --adapter_name_or_path saves/internlm3-8b-instruct/lora/sft \ --template intern \ --finetuning_type lora \ --trust_remote_code True

从推理结果看和源模型的输出有所区别了,那就说明微调完成了

微调完成之后可以将微调的权重和原始的模型合并导出

ASCEND_RT_VISIBLE_DEVICES=0 llamafactory-cli export \ --model_name_or_path /share/new_models/internlm3/internlm3-8b-instruct \ --adapter_name_or_path saves/internlm3-8b-instruct/lora/sft \ --template intern2 \ --finetuning_type lora \ --export_dir saves/internlm3-8b-instruct/lora/megred-model-path \ --export_device auto \ --export_legacy_format False \ --trust_remote_code True

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1146193.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HBuilderX打造高性能H5移动端网页深度剖析

用HBuilderX打造丝滑流畅的H5移动端体验:从开发到优化的实战全解你有没有遇到过这样的场景?精心设计的营销页在PC上跑得飞快,一放到手机里却卡成PPT;用户刚打开页面,还没看清内容就“啪”地关掉了——白屏太久&#xf…

FIR滤波器频率响应特性全面讲解

深入理解FIR滤波器的频率响应:从原理到实战在数字信号处理的世界里,如果说有什么模块是“无处不在”的,那非FIR滤波器莫属。无论是你戴着主动降噪耳机听音乐,还是医生用超声设备查看胎儿影像,背后都少不了它默默工作的…

ArduPilot与BLHeli电调通信超时问题解决:实战案例

ArduPilot与BLHeli电调通信超时?一文讲透实战排障全过程 最近在调试一台基于Pixhawk的四轴飞行器时,遇到了一个典型的“疑难杂症”:上电后电机蜂鸣自检不完整,地面站频频弹出 ESC timeout on channel X 警告,手动…

核心要点:模拟电子技术基础中的增益带宽积

增益带宽积:模拟电路设计中被低估的“性能守恒定律” 你有没有遇到过这样的情况? 一个放大器电路,增益算得精准、电阻选得精密,结果一接上信号——高频部分“塌”了,波形边缘变得圆润迟钝,就像老式电视信号…

TTL电平转换芯片在驱动安装中的作用全面讲解

搞懂TTL电平转换芯片:为什么你的USB转串口总是连不上?你有没有遇到过这样的情况:手里的开发板明明接好了线,电脑也装了驱动,可设备管理器就是不认“COM口”,或者刚识别出来一会儿又掉线?串口调试…

SPICE仿真中二极管温度特性影响的系统学习与实例分析

二极管温漂不是玄学:从SPICE仿真看温度如何“悄悄”改变电路行为你有没有遇到过这样的情况?一款在实验室25C下表现完美的电源电路,到了夏天高温环境却频频重启?或者一个低温环境下勉强启动的设备,在冷启动瞬间输出电压…

一文说清树莓派插针定义的物理编号与BCM区别

树莓派GPIO接线总翻车?一文讲透物理编号和BCM到底怎么用 你有没有过这样的经历:照着教程把LED接到树莓派上,代码跑起来却一点反应都没有?查了又查,线路没错、电源正常、程序也看着没问题——最后才发现,原…

C++ 有用的资源

C 学习资源 官方文档与标准 ISO C 官方网站:提供最新标准、会议记录和核心语言指南。C 参考手册:涵盖语法、标准库及编译器支持情况。 在线教程与课程 LearnCpp.com:从基础到高级的免费教程。C for Programmers (Coursera):由…

一文说清常见USB转串口芯片驱动下载方式

一文说清主流USB转串口芯片的驱动安装与避坑指南 你有没有遇到过这样的情况:手里的开发板插上电脑,设备管理器里却只显示“未知设备”?或者明明装了驱动,COM口刚出现又消失了?更离谱的是,换一台电脑就能用&…

当教育遇上AI:瞬维AI如何为教培行业打开获客新通路?

“酒香也怕巷子深”,这句话正在今天的教育行业上演。随着教育市场日益细分,竞争愈发激烈,许多优质的教育机构、独立教师和知识分享者面临着一个共同的困境:内容做得很用心,产品打磨得很扎实,但就是“被看见…

解密 AI 人工智能里的 Gemini 技术商业化

解密 AI 人工智能里的 Gemini 技术商业化 关键词:Gemini AI、人工智能商业化、多模态模型、技术架构、应用场景、商业模式、挑战与机遇 摘要:本文深入探讨Google DeepMind开发的Gemini人工智能技术的商业化路径。我们将从技术原理出发,分析其多模态架构的创新性,详细解读其…

Altium Designer差分信号布局实战案例详解

差分信号PCB布局实战:从Altium Designer设置到高速USB设计避坑在现代电子系统中,只要涉及“高速”二字——无论是通信、存储还是数据采集——差分信号几乎无处不在。USB、PCIe、以太网、DDR……这些我们每天打交道的接口,背后都依赖着精密的差…

Multisim下载在虚拟课堂中的应用完整示例

用Multisim打造“永不打烊”的电子实验室:一位工科教师的实战手记最近在给大二学生上《模拟电子技术》时,有位同学私信问我:“老师,我在宿舍试了三遍共射放大电路,波形还是失真,但又不敢拆焊重来……” 我看…

arm64平台上交叉编译x64动态库完整步骤

在 arm64 平台交叉编译 x86_64 动态库:从零开始的实战指南你有没有遇到过这种情况:手头只有一台基于 ARM 架构的设备,比如苹果 M1/M2 Mac、树莓派 5 或 NVIDIA Jetson 开发板,但项目却需要为传统的 x86_64 Linux 系统生成一个.so文…

零基础搭建Multisim主数据库:手把手教程

从零开始搭建 Multisim 主数据库:电子工程师的“元件仓库”实战指南你有没有遇到过这种情况——在实验室或公司里,打开别人的 Multisim 工程文件时,弹出一连串“找不到元件”的警告?又或者自己辛辛苦苦建了个新芯片模型&#xff0…

iverilog操作指南:常用命令参数深度剖析

iverilog实战精要:从命令行到高效仿真的完整路径你有没有过这样的经历?写好了Verilog代码,信心满满地敲下iverilog *.v,结果编译器报错:“No top-level module found”?或者明明定义了宏,条件编…

毛球修剪器电路图中驱动电路热管理设计:工程实践指南

毛球修剪器驱动电路热管理实战:从原理到落地的工程笔记你有没有遇到过这种情况——手里的毛球修剪器用着用着突然“罢工”,等几分钟又好了?拆开一看,电机没坏、电池还有电,问题出在哪?答案往往藏在那块不起…

T触发器时序约束设置:FPGA设计中的关键步骤

T触发器与时序约束:FPGA设计中那些容易被忽视的关键细节你有没有遇到过这样的情况?明明逻辑写得没问题,仿真也跑通了,结果烧进FPGA后系统却时不时“抽风”——数据错乱、状态跳变、甚至直接锁死。查来查去,最后发现罪魁…

Altium Designer柔性电路板PCB绘制项目应用解析

Altium Designer柔性电路板设计实战:从叠层建模到3D验证的全流程解析你有没有遇到过这样的场景?手环刚上市三个月,用户反馈“戴了两周屏幕就失灵”;折叠手机反复开合后摄像头信号中断;医疗内窥镜在弯曲部位频繁断线………

Parasoft C/C++test与MISRA C++兼容性问题解析

用好Parasoft C/Ctest,让MISRA C合规不再“纸上谈兵”在汽车电子、工业控制、航空航天等安全关键系统中,一行代码的失误可能引发灾难性后果。因此,软件的可靠性早已不再是“锦上添花”,而是产品能否上市的生死线。C 因其性能优势被…