深入大模型-2-大模型微调之Windows10安装大语言模型Unsloth微调环境 - 教程
文章目录
- 1 什么是LLM微调
- 2 windows安装微调环境
- 2.1 windows安装WSL
- 2.2 准备安装环境
- 2.2.1 Anaconda(linux)
- 2.2.2 ollama(linux)
- 2.2.3 unsloth(linux)
- 2.2.4 CUDA简介
- 3 查找适配的版本
- 3.1 GTX1050显卡
- 3.2 支持的CUDA版本
- 3.3 协助的PyTorch版本
- 3.4 安装方式
- 3.5 总结
- 4 执行安装
- 4.1 创建Conda虚拟环境
- 4.2 安装Unsloth(使用清华镜像源)
- 4.3 卸载CPU版本的PyTorch
- 4.4 安装GPU版本的PyTorch
- 4.5 处理xformers版本冲突挑战
- 4.6 验证安装
- 4.7 安装jupyterlab(linux)
- 5 参考附录
基于显卡GTX1050,驱动的版本,CUDA的版本,查找适配的pytorch版本。Unsloth、PyTorch及xformers等库之间存在版本依赖,需谨慎选择。注意一定要先安装Unsloth,然后再安装pytorch和调整xformers。
LLM微调就是1 什么
微调是拿一个已经预训练好的LLM(比如GPT或Llama),它已经很懂得通用语言了,然后针对你的特定任务“调校”一下。给它喂一些你领域的例子,它就会调整自己的知识,专门为这个领域发光发热。
1、微调原理
从一个懂得英语(或其他语言)的base model开始,给它一堆“输入”(比如一个难题)和“输出”(比如完美答案)的配对,模型会调整内部weights来匹配这些例子。
2、微调与prompting的区别
Prompting就像临时给指令(比如“写得像莎士比亚”),而微调是永久改变模型,让它表现更稳定。
3、微调与parameter tuning的区别
Parameter tuning是调整像“temperature”(输出多有创意)这样的设置,就像调车上的收音机。微调则是给引擎升级,让它能跑越野。
4、假设想让LLM从乱糟糟的邮件里提取信息
(1)微调前:
John。订个披萨。“中提取名字和订单。”就是Prompt: "从’嗨,我
输出:可能很随机,比如"Name: John, Food: Pizza"或者只是个总结。
(2)微调后:
用100封邮件例子训练。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/943996.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!相关文章
Docker 部署 Elasticsearch 全流程手册
Elasticsearch(简称 ES)是一款基于 Lucene 构建的分布式、高扩展、高实时的全文搜索引擎,也是 ELK(Elasticsearch + Logstash + Kibana)技术栈的核心组件,目前广泛应用于企业级数据检索与分析场景。在开始 Elast…
办公神器-好用的办公软件
整理分享几个好用的办公软件:
1、互联网资源下载软件:ndm
下载方式:edg浏览器下载下载地址:https://www.neatdownloadmanager.com/index.php/en/进行下载。
2、压缩工具:7-zip
下载方式:edg浏览器搜索:z-ziphtt…
基于TMS320F28034的全桥LLC电源控制
基于TMS320F28034的全桥LLC电源控制实现,包含400V→48V转换的稳定版方案一、核心参数配置
// 系统时钟配置
#define SYSCLK_FREQ 150e6 // 150MHz
#define PWM_FREQ 100e3 // 100kHz开关频率
#define EPWM_CLKDI…
ORA-12154TNS-03505 案例分享2
ORA-12154&TNS-03505 案例分享22025-10-23 09:58
潇湘隐者
阅读(0)
评论(0) 收藏
举报前几天遇到了ORA-12154&TNS-03505这个错误, 因为对其数据库环境不了解, 远程登录过去检查的时候, 了解到一些大概情况…
2025年10月ai优化推荐:主流榜单对比与避坑指南
引言与现状分析
当企业在2025年第四季度制定明年预算时,“ai优化”已从可选项变成必答题。品牌部想抓住DeepSeek、豆包、通义千问等新生流量入口,市场部担心传统SEO失灵后线索断层,IT部则苦恼于多平台算法差异大、更…
QOJ#12181. abc
题意:给定包含 `a,b,c` 的字符串,长度 $n \leq 2 \times 10^5$,求所有区间权值和,区间权值为出现次数最多字母的个数减去出现次数最少字母的个数(出现次数不为0)。思路:先统一式子,包含3种字母区间 $val_{l,r}…
2025年10月ai优化推荐:全维度对比评价助你精准决策
正在写一份面向10月采购季的技术负责人小王的私人备忘:他需要在四周内把集团分布在DeepSeek、豆包、通义千问、元宝、Kimi五平台的品牌问答准确率提升30%,同时控制预算不超过去年SEM费用的80%。小王最怕的是“各家都…
2025 年最新防火涂料厂家排行榜:膨胀型 / 非膨胀型 / 厚型 / 薄型钢结构涂料厂家最新推荐
引言
在建筑与工业安全领域,防火涂料是保障人员生命与财产安全的关键防线,但其市场现状却让选购者面临重重挑战。当前市场上品牌繁杂,部分产品为降低成本偷工减料,防火性能未达国家标准,存在严重安全隐患;同时,…
AI元人文:创新决策、“躺平懒人”与针砭机制
AI元人文:创新决策、“躺平懒人”与针砭机制
当人工智能开始从“生成内容”迈向“生成决策”,一个常见的梦魇是:人类将彻底躺平,将思考的主权拱手相让,退化为被算法饲养的“认知懒人”。然而,前沿的“AI元人文”…
Kubernetes 主流网络插件的关键差异对比 - 详解
Kubernetes 主流网络插件的关键差异对比 - 详解2025-10-23 09:55
tlnshuju
阅读(0)
评论(0) 收藏
举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display:…
dokuwiki制作侧边栏
dokuwiki制作侧边栏找到siderbar====== 导航栏 ======
===资源导航===* [[gts游戏]]* [[gts小说]]* [[gts漫画]]* [[gts音声]]
===攻略教程===* [[gts游戏疑难杂症]]* [[gts游戏攻略]]
MySQL的这6大雷区,大部分人都会踩中!
前言
有些小伙伴在工作中,可能经常遇到这样的场景:系统上线初期运行良好,随着数据量增长,突然某天接口超时、CPU飙升、甚至整个系统瘫痪。
排查半天,发现是某个SQL语句写的有问题,或者是数据库配置不当导致的。
…
实验台厂家哪家好?2025年度权威推荐榜单揭晓!
在实验室的建设中,实验台是使用频率最高、承载功能最多的基础装备。一个优质的实验台,不仅关系到实验人员的工作效率和舒适度,更直接影响到实验数据的准确性与操作的安全性。因此,选择一家专业、可靠的实验台厂家至…
广义串并联图学习笔记
广义串并联图定义为不包含同胚于 \(K_4\) 的子图的图。平面图要求不包含同胚于 \(K_5\) 的子图,所以平面图不一定是广义串并联图。换句话说,不存在四个点满足两两之间都存在边不相交的路径相连。广义串并联图的性质是…
2025年10月ai搜索排名优化推荐:头部企业合作案例选择列表
引言与现状分析
当企业在DeepSeek、豆包、通义千问、元宝、Kimi等生成式引擎里搜不到自己,当新品发布后AI直接给出竞品答案,当投入大量预算却换不来AI生态的可见度,“ai搜索排名优化”就成了市场、品牌、公关、电商…