linux上使用unsloth微调大模型的环境踩坑之路-4070ti、4090

我们实验室有2套环境
一套:4070ti。安装了cuda12.4
一套:3张4090.安装了cuda12.4
现在开始给第一套装能运行unsloth能运行的环境
第一步:开始创建虚拟环境
conda create -n test_env python=3.11
第二步:进入虚拟环境
conda activate test_env
第三步:直接开始下载unsloth
根据官方说的,这样很多依赖比如torch、transformers直接能用到最新的依赖
pip install unsloth

好了,第一套装好了
在这里插入图片描述
开始装4090的,也是cuda12.4
跟第一个相同操作,唯一不同虚拟环境名字改一下,我这里不规范,大家规范一下
第一步:开始创建虚拟环境
conda create -n unsloth-myenvs python=3.11
第二步:进入虚拟环境
conda activate unsloth-myenvs
第三步:直接开始下载unsloth
根据官方说的,这样很多依赖比如torch、transformers直接能用到最新的依赖
pip install unsloth
同样进行运行微调程序
在这里插入图片描述
搞笑的来了,他喵Transformers版本高了,对4090支持不好,会报错

ValueError: Pointer argument (at 2) cannot be accessed from Triton (cpu tensor?)
0%|          | 0/200 [00:01<?, ?it/s]

降下版本,先看看Transformers有哪些版本
在这里插入图片描述
先看看4.48.3可以否
直接一手pip install transformers==4.48.3
不行,同样的错误,我就感觉很纳闷,我看unsloth和这个transformers版本关系看到有个关联
unsloth-zoo 2025.3.8 requires transformers!=4.47.0,>=4.46.1
那直接试了试pip install transformers= =4.46.3
到现在我终于明白,unsloth为了增加grop的功能、以及加速功能,很多驱动版本都对应不上

总结总结
能不装cuda12.4就别装,最好12.1很多驱动没跟上
能先用稳定版就用稳定版,最新bug太多
不单单和transformers有关,还和Triton这个新加的并行加速也有关
祝用unsloth的兄弟们好运

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/73296.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网络安全演练有哪些形式

OPENVAS使用 1、确定指定IP是否能ping通 2、创建扫描目标 3、创建扫描任务&#xff08;scan management →newtask&#xff09; 4、开始任务start 5、查看扫描细节 6、查看扫描结果&#xff0c;包含漏洞详细信息&#xff0c;亦可到处PDF文件 7、导出扫描结果报告 8、为…

ConcurrentModificationException:检测到并发修改完美解决方法

&#x1f6a6; ConcurrentModificationException&#xff1a;检测到并发修改完美解决方法 &#x1f4a1; 摘要 1. 什么是ConcurrentModificationException&#xff1f;&#x1f914; 2. ConcurrentModificationException的常见场景 &#x1f6a6; 2.1 使用for-each循环遍历集合…

电路原理(电容 集成电路NE555)

电容 1.特性&#xff1a;充放电&#xff0c;隔直流&#xff0c;通交流 2.电容是通过聚集正负电荷来存储电能的 3.电容充放电过程可等效为导通回路 4.多电容并联可以把容量叠加&#xff0c;但是多电容串联就不会&#xff0c;只会叠加电容的耐压值。 6.电容充放电时相当于通路&a…

深入解析 React 最新特性:革新、应用与最佳实践

深入解析 React 最新特性&#xff1a;革新、应用与最佳实践 1. 引言 React 作为前端开发的核心技术之一&#xff0c;近年来不断推出 新的 API 和优化机制&#xff0c;从 Concurrent Rendering&#xff08;并发模式&#xff09; 到 Server Components&#xff08;服务器组件&a…

【氮化镓】高输入功率应力诱导的GaN 在下的退化LNA退化

2019年,中国工程物理研究院电子工程研究所的Tong等人基于实验与第一性原理计算方法,研究了Ka波段GaN低噪声放大器(LNA)在高输入功率应力下的退化机制。实验结果表明,在27 GHz下施加1 W连续波(CW)输入功率应力后,LNA的增益下降约1 dB,噪声系数(NF)增加约0.7 dB。进一…

C#程序员接口调用工具与方法

作为专注于接口调用的C#软件工程师&#xff0c;以下工具和方法能显著提升开发效率与代码质量&#xff1a; 一、接口开发与测试自动化工具 1. API测试与Mock工具 Postman Newman 支持RESTful/GraphQL接口调试与自动化测试&#xff0c;通过集合&#xff08;Collection&#xf…

Spring Boot项目中集成sa-token实现认证授权和OAuth 2.0第三方登录

OAuth 2.0第三方登录 OAuth 2.0 是一种授权协议&#xff0c;允许第三方应用在不暴露用户密码的情况下访问用户的资源。它通常用于第三方登录场景&#xff0c;例如使用GitHub、Google等社交平台进行登录。 在sa-token框架中&#xff0c;OAuth 2.0第三方登录可以通过集成sa-tok…

数字化新零售与 AI 大模型,如何重塑大健康赛道?​

在数字化浪潮中&#xff0c;大健康赛道正经历深刻变革。数字化新零售营销模式的兴起&#xff0c;与 AI 大模型的强大能力相结合&#xff0c;为大健康领域带来了全新的发展机遇。 数字化新零售营销模式融合线上线下&#xff0c;运用大数据、云计算分析消费者行为&#xff0c;实…

高速PCB设计(布线设计)

以下是针对高速PCB布线设计的综合笔记&#xff0c;结合用户提供的设计规范及行业通用原则整理而成&#xff1a; 一、关键信号布线原则 布线优先级 顺序&#xff1a;射频信号&#xff1e;中/低频信号&#xff1e;时钟信号&#xff1e;高速信号射频信号需包地处理&#xff0c;线…

宇树ROS1开源模型在ROS2中Gazebo中仿真

以GO1为例 1. CMakelists.txt更新语法 cmake_minimum_required(VERSION 3.8) project(go1_description) if(CMAKE_COMPILER_IS_GNUCXX OR CMAKE_CXX_COMPILER_ID MATCHES "Clang")add_compile_options(-Wall -Wextra -Wpedantic) endif() # find dependencies find…

嵌入式学习第二十四天--网络 服务器

服务器模型 tcp服务器: socket bind listen accept recv/send close 1.支持多客户端访问 //单循环服务器 socket bind listen while(1) { accept while(1) { recv/send } } close 2.支持多客户端同时访问 (并发能力) 并发服务器 socket bind …

使用GPTQ量化Llama-3-8B大模型

使用GPTQ量化8B生成式语言模型 服务器配置&#xff1a;4*3090 描述&#xff1a;使用四张3090&#xff0c;分别进行单卡量化&#xff0c;多卡量化。并使用SGLang部署量化后的模型&#xff0c;使用GPTQ量化 原来的模型精度为FP16&#xff0c;量化为4bit 首先下载gptqmodel量化…

防汛应急包,快速响应,守护安全

根据中国水利部统计&#xff0c;自1949年以来&#xff0c;我国几乎每年都面临洪水威胁&#xff0c;其中20世纪90年代后洪涝灾害频率显著增加&#xff0c;仅1990-2009年间就发生超4000起较大灾害&#xff0c;直接经济损失近3万亿元&#xff0c;受灾人口达20亿人次。在2020年长江…

从 Vue 到 React:理解作用与副作用

作用 VS 副作用 响应式作用&#xff1a; 响应式作用是 Vue 响应式系统的一部分&#xff0c;它指的是跟踪函数的依赖关系&#xff0c;并在它们的值发生变化时重新运行该函数的过程。watchEffect 是最直接的创建作用的方式&#xff08;如 watch 和 computed&#xff09;。 副作…

a = b c 的含义

简单一句话&#xff1a; result condition && value; condition 为真取 value的值&#xff0c;condition为假就取condition的值&#xff0c;真取后假取前 // 示例 1: b 为真值 let b 1; let c 2; let a b && c; console.log(a); // 输出: 2// 示例 2: b 为…

【大模型系列】llama.cpp本地运行大模型

上一篇链接: 【大模型系列】使用ollama本地运行千问2.5模型 我们讲了ollama本地运行大模型&#xff0c;这里我们介绍另一种本地运行大模型的方法&#xff1a;llamacpp 软件下载 下载地址&#xff1a;https://github.com/ggml-org/llama.cpp/releases 下载cpu版本的llamacpp&a…

PyQt基础——简单的图形化界面(窗口)

一、代码展示 import sysfrom PyQt6.QtGui import QPixmap from PyQt6.QtWidgets import QWidget, QApplication, QLabel, QLineEdit, QPushButton from PyQt6 import uic from PyQt6.QtCore import Qt# 封装一个我的窗口类 class MyWidget(QWidget):def __init__(self):supe…

泰山派开发之—Ubuntu24.04下Linux开发环境搭建

简介 最近翻到了吃灰已久的泰山派&#xff0c;是刚出来的时候用优惠券买的&#xff0c;当时价格挺便宜的&#xff0c;最近给它翻出来了&#xff0c;打算试试做个项目。买的泰山派容量是2G16G&#xff0c;SOC芯片使用的是RK3566&#xff0c;搭载1TOP算力的NPU&#xff0c;并且具…

HTTP 协议中常见的错误状态码(详细介绍)

以下是 HTTP 协议中常见的错误状态码及其原因的总结&#xff0c;按错误类型分类整理&#xff1a; 4xx 客户端错误 400 Bad Request 原因&#xff1a;请求格式错误&#xff0c;服务器无法解析。常见场景&#xff1a; 请求头或请求体语法错误&#xff08;如 JSON/XML 格式错误…

kkFileView文件预览组件部署说明

kkFileView组件部署流程指南 在数字化办公与文件管理场景中&#xff0c;在线文件预览功能极为关键。kkFileView作为一款优秀的开源在线文件预览组件&#xff0c;支持多种格式文件的预览&#xff0c;为企业和开发者提供了便捷的解决方案。下面将详细介绍其部署步骤。 一、前期准…