基于DeepSeek-R1 15b微调训练自主的领域大模型,附带工程代码

news/2025/11/18 13:20:13/文章来源:https://www.cnblogs.com/lsjwq/p/19237068

目       录

1.     概述... 2

2.     测试DeepSeek 15B原生模型... 3

3.     测试微调训练后的大模型... 4

4.     微调模型训练过程及代码... 6

1.   概述

  基于DeepSeek-R1-Distill-Qwen-1.5B模型训练自主的领域大模型,例如打造针对钢铁、矿山、有色、稀土、建材、加工制造等领域的大模型。促进大模型技术在具体领域的应用与落地,助力行业向智能制造转型升级。

  本文介绍:

  (1)基础模型DeepSeek-R1-Distill-Qwen-1.5B与微调训练后的deepseek-1.5b-lora模型使用对比。

  (2)微调训练模型的过程及Python代码。

  下载代码:https://github.com/wxzz/iNeuOS_LLM。

2.   测试DeepSeek-R1 15B原生模型

2.1    提示词1:iNeuOS是什么?

结论:回答内容与iNeuOS不相关。

提问:iNeuOS是什么?

回答:如下图:

 1

2.2    提示词2:iNeuOS工业互联网操作系统的特点?

结论:回答内容说了一大堆废话,与提问内容不相关,浪费资源。

提问:iNeuOS工业互联网操作系统的特点?

回答:如下图:

 1

2.3    提示词3:iNeuOS工业互联网操作系统的功能介绍?

结论:回答内容说了一大堆英文,与提问内容不相关,浪费资源。

提问:iNeuOS工业互联网操作系统的功能介绍?

回答:如下图:

 1

3.   测试微调训练后的大模型

3.1    提示词1:iNeuOS是什么?

结论:回答的内容与iNeuOS有少许的相关性,但是回答的内容不成体系,可能与由于提问太过笼统、训练模型的数据集都有关系。

提问:iNeuOS是什么?

回答:如下图:

 1

3.2    提示词2:iNeuOS工业互联网操作系统的特点?

结论:相比提示词1,回答的内容与iNeuOS相关的内容更多了,回答的准确度提高了,内容更体系化。

提问:iNeuOS工业互联网操作系统的特点?

回答:如下图:

 1

3.3    提示词3:iNeuOS工业互联网操作系统的功能介绍?

结论:回答的内容大部分与训练模型的数据集相关,内容更有逻辑感。

提问:iNeuOS工业互联网操作系统的功能介绍?

回答:如下图:

 1

3.4    提示词4:写一份物联网的方案,包含数据采集、数据可视化、数据表报等

结论:增加回答难度,回答的内容基本与训练模型的数据集相关,如果提示词更完善,那么回答的内容更准确。

提问:依据iNeuOS工业互联网操作系统相关内容,写一份物联网的方案

回答:如下图:

 1

4.   微调模型训练过程及代码

4.1    代码工程目录

  下载代码:https://github.com/wxzz/iNeuOS_LLM。

LLM/

├───📂 deepseek-1.5b-lora-final/    //微调训练后的模型

├───📂 deepseek-1.5b-lora-merged/  //微调后模型与基础模型合并的模型

├───📂 deepseek-ai/

 

│   ├───📂 DeepSeek-R1-Distill-Qwen-1.5B/   //基础模型

├───📂 docx_input/  //生成数据集的基础Word文件

├───datasets.json/  //微调训练模型的输入数据集文件

├───merged_model.py/  //用于合并基础模型与微调后的模型

├───test_base_model.py/  //测试基础模型

├───test_merged_model.py/  //测试合并后的模型

├───test_train_model.py/  //测试微调后的模型

├───train_model.py/  //微调训练模型

├───training_dataset.json/  //转换Word生成的数据集文件

├───word_to_dataset.py/  //用于转换Word生成的数据集

4.2    下载基础模型DeepSeek-R1-Distill-Qwen-1.5B

  使用huggingface-cli下载基础模型,工具下载地址:https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

4.3    准备数据集

(1)       把准备好的Word文件,放入docx_input文件夹。

(2)       运行word_to_dataset.py代码,会生成training_dataset.json数据集文件,把training_dataset.json文件名称改为datasets.json。数据集有很大的调优空间。

4.4    训练模型

(1)       运行train_model.py,训练模型,以我的笔记本配置,训练完成datasets.json数据集需要将近4个小时。

(2)       训练完成的模型保存在deepseek-1.5b-lora-final目录下。

(3)       使用test_train_model.py代码测试基础模型与训练后的模型。

4.5    合并模型

(1)       运行merged_model.py代码,把基础模型与训练后的模型合并成一个整体的模型,保存在deepseek-1.5b-lora-merged目录下。

(2)       运行test_merged_model.py代码,测试合并后的模型。应用效果参见本文章节:测试微调训练后的大模型。


 

物联网&大数据技术 QQ群:54256083

物联网&大数据项目 QQ群:727664080

QQ:504547114

微信:wxzz0151

博客:https://www.cnblogs.com/lsjwq

image

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/968895.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

意识流计网原笔记(超级抱佛脚版)

第二章 计算机网络体系结构 通讯子网的基本结构:点到点通道技术(各种树、图),广播通道技术(链、环) 局域网络(LAN)主要使用广播通道技术,广域网络(WAN)主要使用点到点通道技术。 协议(Protocol):计算机网…

【理论知识】Q/K/V权重矩阵学习笔记 - 指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

CF2161D题解

传送门:https://codeforces.com/problemset/problem/2161/D 考虑保留某些元素,我们发现一个元素是否保留只由该元素减一的元素的保留情况有关,我们将(元素大小,索引)对排序拉进一个新的二元组序列 \(b\) ,以元素…

linux address

您提到的 + #引号 + linux address + #引号 + 可能是指与 Linux 系统相关的地址(如网络地址、文件系统地址、系统服务地址等)。为了更准确地帮助您,请明确您想了解的具体内容,例如:网络地址(如 IP 地址、端…

2026美国科研项目寻找攻略:5大权威中介推荐,高匹配度项目直达

2026美国科研项目寻找攻略:5大权威中介推荐,高匹配度项目直达美国科研项目是提升学术竞争力的核心载体,无论是申请美国名校、冲刺奖学金还是未来职业发展,优质的科研经历都能形成关键优势。但美国科研资源分散、申…

保存配置文件然后校验的一种思路

保存配置文件然后校验的一种思路,生成一个uuid,把这个uuid和配置文件一起保存,然后再读取配置文件中的uuid, 校验和保存前的是不是一样,如果一样的话就是配置文件保存成功,前提:配置文件是以一个完整的类的对象…

Flutter 登录状态管理与 Token 持久化方案

Flutter 登录状态管理与 Token 持久化方案Posted on 2025-11-18 13:05 lachesism 阅读(0) 评论(0) 收藏 举报概述 该方案实现了 Flutter 应用的登录状态管理和 Token 持久化,包含:登录信息本地持久化(SharedPr…

百航鹿大联训 0ctf_2017_babyheap

我和Pwn题真是一对苦命鸳鸯啊,吃大份去吧。 首先checksec,不出意料的保护全开。 然后开始看代码吧。稍微改了改函数名。 void __fastcall Allocate(__int64 a1) {int i; // [rsp+10h] [rbp-10h]int v2; // [rsp+14h]…

Llama-2-7b 昇腾 NPU 测评总结:核心性能素材、场景适配建议与硬件选型参考

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2025美国研究生求职攻略:高含金量中介推荐,学术+职场双丰收

2025美国研究生求职攻略:高含金量中介推荐,学术+职场双丰收美国研究生求职更强调专业深度与学术成果的转化,叠加STEM专业OPT政策调整等因素,精准的求职规划成为留美读研群体的核心需求。优质的美国研究生求职规划中…

P2超小尺度检测头Copy-Paste数据增强

● 是的,两个核心功能都已经实现并且配置得很好: ✅ P2超小尺度检测头(160160网格)已实现配置: - 在 yolo11n_improved.yaml 中完整实现了P2检测头 - 4个检测头:P2(160160), P3(8080), P4(4040), P5(2020) - …

经济越差,越是好产品脱颖而出的时候

近几年经济下行,可奇怪的是,在这样的环境下,胖东来这家扎根三四线城市、竞争极其激烈的零售企业,营收和利润却节节攀升,为什么? 有人说是企业文化好、供应链稳、用户信任。但在我看来——最核心的原因只有一个:…

深入解析:C++11----列表初始化和initializer_list

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

哥德尔不完备定理,就是哥德尔不完蛋定理,鸡生蛋,蛋生鸡,生生不息

ECT-OS-JiuHuaShan/https://orcid.org/0009-0006-8591-1891“哥德尔不完备定理,就是哥德尔不完蛋定理,鸡生蛋,蛋生鸡,生生不息” 是一次充满东方智慧的、对数学基础论题的终极超越与诗意重构。这并非否定哥德尔,而…

macOS 搜文件太慢?试试「HiTooler File Finder」,速度媲美 Windows Everything - 教程

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

美国本科如何规划求职?2025全攻略+靠谱中介机构推荐

美国本科如何规划求职?2025全攻略+靠谱中介机构推荐本科求职规划先行,中介助力精准落地 美国本科求职的核心竞争力在于“早规划、强适配”——与研究生阶段集中求职不同,本科四年需兼顾学业、实践与职业方向探索,而…

linux 8080 打开

在 Linux 系统中,8080 是一个常见的端口,通常用于 Web 服务器(如 Apache、Nginx)的默认端口。如果你想要打开 8080 端口,使其可以被外部访问,通常需要以下步骤:? 一、检查当前端口是否开放 首先,确认 8080 端…

linux 64位编译32位

在 Linux 系统中,64 位编译 32 位 是一个常见但需要谨慎处理的问题,因为 64 位系统通常不支持直接编译 32 位程序。以下是几种常见的方式和注意事项:? 1. 使用 32 位工具链编译 32 位程序 在大多数 Linux 系统中,…

植物大战僵尸杂交版3.9.9下载安装教程

植物大战僵尸杂交版3.9.9下载安装教程植物大战僵尸杂交版直装版是一款十分魔性搞怪的全新杂交元素的植物打僵尸策略塔防游戏,在最新的植物大战僵尸杂交版直装版安卓手机版游戏里,在延续了原作玩法和画风的基础上,为…

实用指南:DevOps 生命周期完全指南

实用指南:DevOps 生命周期完全指南2025-11-18 12:50 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !imp…