深入大模型-2-大模型微调之Windows10安装大语言模型Unsloth微调环境 - 教程

news/2025/10/23 10:03:50/文章来源:https://www.cnblogs.com/slgkaifa/p/19159697

深入大模型-2-大模型微调之Windows10安装大语言模型Unsloth微调环境 - 教程

文章目录

  • 1 什么是LLM微调
  • 2 windows安装微调环境
    • 2.1 windows安装WSL
    • 2.2 准备安装环境
      • 2.2.1 Anaconda(linux)
      • 2.2.2 ollama(linux)
      • 2.2.3 unsloth(linux)
      • 2.2.4 CUDA简介
  • 3 查找适配的版本
    • 3.1 GTX1050显卡
    • 3.2 支持的CUDA版本
    • 3.3 协助的PyTorch版本
    • 3.4 安装方式
    • 3.5 总结
  • 4 执行安装
    • 4.1 创建Conda虚拟环境
    • 4.2 安装Unsloth(使用清华镜像源)
    • 4.3 卸载CPU版本的PyTorch
    • 4.4 安装GPU版本的PyTorch
    • 4.5 处理xformers版本冲突挑战
    • 4.6 验证安装
    • 4.7 安装jupyterlab(linux)
  • 5 参考附录

基于显卡GTX1050,驱动的版本,CUDA的版本,查找适配的pytorch版本。Unsloth、PyTorch及xformers等库之间存在版本依赖,需谨慎选择。注意一定要先安装Unsloth,然后再安装pytorch和调整xformers。

LLM微调就是1 什么

微调是拿一个已经预训练好的LLM(比如GPT或Llama),它已经很懂得通用语言了,然后针对你的特定任务“调校”一下。给它喂一些你领域的例子,它就会调整自己的知识,专门为这个领域发光发热。

1、微调原理
从一个懂得英语(或其他语言)的base model开始,给它一堆“输入”(比如一个难题)和“输出”(比如完美答案)的配对,模型会调整内部weights来匹配这些例子。
2、微调与prompting的区别
Prompting就像临时给指令(比如“写得像莎士比亚”),而微调是永久改变模型,让它表现更稳定。
3、微调与parameter tuning的区别
Parameter tuning是调整像“temperature”(输出多有创意)这样的设置,就像调车上的收音机。微调则是给引擎升级,让它能跑越野。
4、假设想让LLM从乱糟糟的邮件里提取信息
(1)微调前:
John。订个披萨。“中提取名字和订单。”就是Prompt: "从’嗨,我
输出:可能很随机,比如"Name: John, Food: Pizza"或者只是个总结。
(2)微调后:
用100封邮件例子训练。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/943996.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

K.20

K.20K20ITU-T K.20建议书规定了安装在电信中心的电信设备的抗力要求和测试程序。本建议书所述的过电压或过电流是指包括发电厂上或附近发生雷击、相邻交流电源线或铁路系统造成短期导电、电源故障引发大地电位上升以及…

C#语法查缺补漏

C#语法补充 空条件运算符和空合并运算符var clientIp = context.HttpContext.Connection.RemoteIpAddress?.ToString() ?? "unknown";- 首先RemoteIpAddress允许为空 - 若这个表达式(context.HttpContext…

Docker 部署 Elasticsearch 全流程手册

Elasticsearch(简称 ES)是一款基于 Lucene 构建的分布式、高扩展、高实时的全文搜索引擎,也是 ELK(Elasticsearch + Logstash + Kibana)技术栈的核心组件,目前广泛应用于企业级数据检索与分析场景。在开始 Elast…

办公神器-好用的办公软件

整理分享几个好用的办公软件: 1、互联网资源下载软件:ndm 下载方式:edg浏览器下载下载地址:https://www.neatdownloadmanager.com/index.php/en/进行下载。 2、压缩工具:7-zip 下载方式:edg浏览器搜索:z-ziphtt…

基于TMS320F28034的全桥LLC电源控制

基于TMS320F28034的全桥LLC电源控制实现,包含400V→48V转换的稳定版方案一、核心参数配置 // 系统时钟配置 #define SYSCLK_FREQ 150e6 // 150MHz #define PWM_FREQ 100e3 // 100kHz开关频率 #define EPWM_CLKDI…

ORA-12154TNS-03505 案例分享2

ORA-12154&TNS-03505 案例分享22025-10-23 09:58 潇湘隐者 阅读(0) 评论(0) 收藏 举报前几天遇到了ORA-12154&TNS-03505这个错误, 因为对其数据库环境不了解, 远程登录过去检查的时候, 了解到一些大概情况…

2025年10月ai优化推荐:主流榜单对比与避坑指南

引言与现状分析 当企业在2025年第四季度制定明年预算时,“ai优化”已从可选项变成必答题。品牌部想抓住DeepSeek、豆包、通义千问等新生流量入口,市场部担心传统SEO失灵后线索断层,IT部则苦恼于多平台算法差异大、更…

QOJ#12181. abc

题意:给定包含 `a,b,c` 的字符串,长度 $n \leq 2 \times 10^5$,求所有区间权值和,区间权值为出现次数最多字母的个数减去出现次数最少字母的个数(出现次数不为0)。思路:先统一式子,包含3种字母区间 $val_{l,r}…

2025年10月ai优化推荐:全维度对比评价助你精准决策

正在写一份面向10月采购季的技术负责人小王的私人备忘:他需要在四周内把集团分布在DeepSeek、豆包、通义千问、元宝、Kimi五平台的品牌问答准确率提升30%,同时控制预算不超过去年SEM费用的80%。小王最怕的是“各家都…

行业配置策略

策略逻辑搭建框架:行业景气度、趋势和拥挤度 构建模型: 2.1 行业景气模型:高景气+强趋势,规避高拥挤 2.2 行业趋势模型:强趋势+低拥挤,规避低景气 组合优化:轮动型/配置型 设置不同约束 求解行业权重 落地ETF/个…

2025 年最新防火涂料厂家排行榜:膨胀型 / 非膨胀型 / 厚型 / 薄型钢结构涂料厂家最新推荐

引言 在建筑与工业安全领域,防火涂料是保障人员生命与财产安全的关键防线,但其市场现状却让选购者面临重重挑战。当前市场上品牌繁杂,部分产品为降低成本偷工减料,防火性能未达国家标准,存在严重安全隐患;同时,…

AI元人文:创新决策、“躺平懒人”与针砭机制

AI元人文:创新决策、“躺平懒人”与针砭机制 当人工智能开始从“生成内容”迈向“生成决策”,一个常见的梦魇是:人类将彻底躺平,将思考的主权拱手相让,退化为被算法饲养的“认知懒人”。然而,前沿的“AI元人文”…

Kubernetes 主流网络插件的关键差异对比 - 详解

Kubernetes 主流网络插件的关键差异对比 - 详解2025-10-23 09:55 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display:…

dokuwiki制作侧边栏

dokuwiki制作侧边栏找到siderbar====== 导航栏 ====== ===资源导航===* [[gts游戏]]* [[gts小说]]* [[gts漫画]]* [[gts音声]] ===攻略教程===* [[gts游戏疑难杂症]]* [[gts游戏攻略]]

MySQL的这6大雷区,大部分人都会踩中!

前言 有些小伙伴在工作中,可能经常遇到这样的场景:系统上线初期运行良好,随着数据量增长,突然某天接口超时、CPU飙升、甚至整个系统瘫痪。 排查半天,发现是某个SQL语句写的有问题,或者是数据库配置不当导致的。 …

实验台厂家哪家好?2025年度权威推荐榜单揭晓!

在实验室的建设中,实验台是使用频率最高、承载功能最多的基础装备。一个优质的实验台,不仅关系到实验人员的工作效率和舒适度,更直接影响到实验数据的准确性与操作的安全性。因此,选择一家专业、可靠的实验台厂家至…

ceph-csi

ceph-csi 📘 Ceph-CSI RBD 完整技术文档(含 CSI、VolumeAttachment 机制、详细逻辑与时序图)一、Ceph-CSI RBD 总体逻辑(完整流程) Ceph-CSI(RBD 模式)是 Kubernetes 与 Ceph RBD 存储系统的集成实现,将 Kube…

广义串并联图学习笔记

广义串并联图定义为不包含同胚于 \(K_4\) 的子图的图。平面图要求不包含同胚于 \(K_5\) 的子图,所以平面图不一定是广义串并联图。换句话说,不存在四个点满足两两之间都存在边不相交的路径相连。广义串并联图的性质是…

2025年10月ai搜索排名优化推荐:头部企业合作案例选择列表

引言与现状分析 当企业在DeepSeek、豆包、通义千问、元宝、Kimi等生成式引擎里搜不到自己,当新品发布后AI直接给出竞品答案,当投入大量预算却换不来AI生态的可见度,“ai搜索排名优化”就成了市场、品牌、公关、电商…