kiln微调大模型-使用deepseek R1去训练一个你的具备推理能力的chatGPT 4o

前言

        随着deepseek的爆火,对于LLM的各种内容也逐渐步入我的视野,我个人认为,可能未来很长一段时间,AI将持续爆火,进入一段时间的井喷期,AI也会慢慢的走入我们每个家庭之中,为我们的生活提供便利,由此出发,我将在接下的内容里面给大家讲一下如何使用kiln.ai去微调你自己的大模型

微调工具介绍

        本文使用的为最简单的kiln AI,Kiln AI 是一款开源的 AI 开发工具,能够简化大型语言模型大型语言模型(LLM)的微调、合成数据生成和数据集协作。它提供直观的桌面应用程序,支持 Windows、MacOS 和 Linux,用户可以基于零代码方式对多种模型进行微调并自动部署。

        如果你看完本文觉得很简单,可以去尝试进阶版的unsloth和其他的微调工具,功能会更加强大,具备更多功能

(下图来自b站up九析,大家可以去up那学习一下,我讲的可能还有很多不到位的)

 安装kiln AI

下载连接:Kiln 的 GitHub 发布页面大型语言模型

(因为是github链接,需要翻墙)

下图为Windows安装包

 下载解压好后双击运行就行

安装运行之后会在网页打开一个标签页

这样就安装好了 

开始训练微调数据集 

接下来我们需要用到ollama蒸馏的deepseek R1 14b模型(因为低于14b在继续数据集训练时会出错)和open ai的key

【我后面会专门出一个安装ollama,并在本地上跑的教程,暂时不会的小伙伴可以先了解流程后续实践一下】

 

点击GET STARTED我们开始kiln AI微调的大门

 在这里连接本地的ollama和openAI的key

 

创建你的项目名 ,也可以直接用案例

接着编写你这个项目的要求和任务(可以理解为你想这个智能体成为什么样的人),我这也是直接使用的案例(创建一个笑话生成器) 

 

run这里写入你的主题,然后选择你的模型,他会根据你的要求生成一个回答

 

生成的数据会在dataset里面显示

 

在这里使用openAI去生成你要生成的主题和他对应的子主题,然后生成你需要的数据,当所有数据生成完毕时点击save all

 

 在弹出的面板里点击你需要的微调的模型,比如我们这边就是deepseek R1(因为我们需要把open AI的训练出自主思考的能力)

然后点击run and save去用deepseek R1讲数据集进行整合 (需要等待一段时间)

由此我们就将数据集准备好了,下一篇讲如何运用这个数据集去训练我们的微调模型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/71957.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用AI玩游戏1——狼人杀六人局

狼人杀六人局1 狼人杀六人局1,好人阵营有两个平民,一个预言家,一个守卫,坏人阵营有两个狼人。狼人每晚可以选择杀死一个人但第一天晚上不能杀人,狼人晚上可以睁眼识别到同伴和其他好人玩家但不知道他们的身份。预言家…

sqli-labs

Less-8 单引号报错,双引号显示正常 又是You are in......看来还是用盲注 布尔盲注: 如下语句是用来判断当前数据库名的第一个字母是不是s,后面的以此类推,比较复杂和麻烦 ?id1 and substr(database(),1,1)s -- 比如这个我们通…

自定义ToolbarView实战指南(Kotlin版)

一、为什么我们需要造轮子? 看到标题你可能会问:系统自带Toolbar不香吗?确实香,但遇到这些场景就抓瞎了: 设计稿要求标题栏带渐变背景动态波浪线产品经理非要搞个不对称的返回按钮布局UI设计师坚持标题和副标题要45度…

微软推出Office免费版,限制诸多,只能编辑不能保存到本地

易采游戏网2月25日独家消息:微软宣布推出一款免费的Office版本,允许用户进行基础文档编辑操作,但限制颇多,其中最引人关注的是用户无法将文件保存到本地。这一举措引发了广泛讨论,业界人士对其背后的商业策略和用户体验…

PyTorch-基础(CUDA、Dataset、transforms、卷积神经网络、VGG16)

PyTorch-基础 环境准备 CUDA Toolkit安装(核显跳过此步骤) CUDA Toolkit是NVIDIA的开发工具,里面提供了各种工具、如编译器、调试器和库 首先通过NVIDIA控制面板查看本机显卡驱动对应的CUDA版本,如何去下载对应版本的Toolkit工…

Vue2+Element实现Excel文件上传下载预览【超详细图解】

目录 一、需求背景 二、落地实现 1.文件上传 图片示例 HTML代码 业务代码 2.文件下载 图片示例 方式一:代码 方式二:代码 3.文件预览 图片示例 方式一:代码 方式二:代码 一、需求背景 在一个愉快的年后&#xff…

【Bug】natten:安装报错(临近注意力机制的高效cuda内核实现)

正常安装natten报错 pip install natten 报错 可以尝试使用以下网站进行安装 https://shi-labs.com/natten/ 可以根据自己的cuda与pytorch版本进行安装 之间复制命令即可,不需要进行任何修改

win10把c盘docker虚拟硬盘映射迁移到别的磁盘

c盘空间本身就比较小、如果安装了docker服务后,安装的时候没选择其他硬盘,虚拟磁盘也在c盘会占用很大的空间,像我的就三十多个G,把它迁移到其他磁盘一下子节约几十G 1、先输入下面命令查看 docker 状态 wsl -l -v 2、如果没有停止…

动态内容加载的解决方案:Selenium与Playwright对比故障排查实录

方案进程 2024-09-01 09:00 | 接到亚航航班数据采集需求 2024-09-01 11:30 | 首次尝试使用Selenium遭遇Cloudflare验证 2024-09-01 14:00 | 切换Playwright方案仍触发反爬机制 2024-09-01 16:30 | 引入爬虫代理IPUA轮换策略 2024-09-02 10:00 | 双方案完整实现并通过压力测试故…

MaxKB上架至阿里云轻量应用服务器镜像市场

近日,MaxKB开源知识库问答系统已上架至阿里云轻量应用服务器镜像市场,目前是阿里云此类镜像市场中唯一推荐的AI应用镜像。 ▲图1 MaxKB已经上架至阿里云轻量应用服务器镜像市场 MaxKB是飞致云旗下开源项目,是一款基于大语言模型和RAG&…

蓝桥杯 2013 省 B 翻硬币

题目背景 小明正在玩一个“翻硬币”的游戏。 题目描述 桌上放着排成一排的若干硬币。我们用 * 表示正面,用 o 表示反面(是小写字母,不是零),比如可能情形是 **oo***oooo,如果同时翻转左边的两个硬币&…

分享---rpc运维事故处理

事故案例03 - Qserver RPC调用大量失败 一、事故背景 Queryserver是内部的核心服务,负责处理数据查询请求并支持分布式缓存功能。为优化缓存一致性,新增了分布式锁逻辑:在查询请求命中缓存时需先获取分布式锁(基于Tair实现&…

string类详解(下)

文章目录 4. string类的模拟实现4.1 构造 析构4.2 c_str4.3 下标遍历4.4 迭代器4.5 插入4.6 删除4.7 查找4.8 赋值4.9 交换4.10 提取子串4.11 比较大小4.12 流插入 && 流提取 5. 现代版写法的String类5.1 完整代码 6. 写时拷贝(了解) 4. string…

win11本地部署deepseek大模型(安装ollama+docker+open-webui)最终实现自己的项目可通过API调用投喂数据后的模型

硬件配置:笔记本win11,内存32G,CPU锐龙7 ,无独显;只能考虑deepseek-r1:1.5b模型。 第一步:安装Ollama 此处不过多累赘了,https://ollama.com/官网选择对应的系统版本下载即可。 需要注意的是…

WebSocket简单介绍 并接入deepseek

目录 什么是 WebSocket?工作原理: 为什么需要 WebSocket?WebSocket 的优势HTTP 和 WebSocket 的区别WebSocket 的劣势WebSocket 的应用场景WebSocket 握手过程1. 客户端发起握手请求2. 服务器响应握手请求3. 建立连接 WebSocket 事件处理WebS…

虚拟机安装教程

一、软件下载与安装 运行安装程序: 双击下载的.exe文件,运行安装程序。 按照安装向导的提示进行操作。 通常情况下,你需要接受许可协议,选择安装目录(建议使用默认路径,除非你有特殊需求),并选…

order by布尔盲注、时间盲注

pdo防御下,order by、limit不能参数绑定,可以进行sql注入 案例:靶场的less-46 布尔盲注: import requests from lxml import htmldef get_id_one(URL, paload):res requests.get(urlURL, paramspaload)tree html.fromstring(…

springboot集成deepseek4j

1、文档地址 快速开始 - 零基础入门Java AI 免费的模型 Models 2、pom文件依赖 parent依赖 <dependency><groupId>com.squareup.okhttp3</groupId><artifactId>okhttp</artifactId><version>4.12.0</version></dependency>&…

Visual Studio Code 跨平台安装与配置指南(附官方下载链接)

一、软件定位与核心功能 Visual Studio Code&#xff08;简称VS Code&#xff09;是微软开发的开源跨平台代码编辑器&#xff0c;支持超过50种编程语言的智能补全、调试和版本控制功能。2025版本新增AI辅助编程模块&#xff0c;可自动生成单元测试代码和API文档注释。 二、下载…

elementplus点击按钮直接预览图片

引用&#xff1a;https://blog.csdn.net/this_zq/article/details/134535539 <el-image-viewerv-if"showImagePreview":zoom-rate"1.2"close"closePreview":url-list"imgPreviewList"/>const showImagePreview ref(false) cons…