LLaMA-Factory微调大模型Qwen2.5

1、开始ModelScope社区GPU环境

训练或微调模型都是非常耗费算力的。如果电脑的配置不高,可使用一些云服务器来做这项工作。如ModelScope(魔搭)社区的GPU环境,目前提供36小时免费运算,足够微调一个大模型了。

注册ModelScope(魔搭)社区账号(可能还要注册或认证阿里云账号),进入“我的NoteBook”:

我的Notebook · 魔搭社区

启动大概需要2分钟,等GPU环境启动好以后点击"查看NoteBook"进入。

开启后,会提示永久性数据只保存在/mnt/workspace/目录下。

魔塔社区内置了JupyterLab的功能,进入之后,可以找到 Notebook 标签,新建一个Notebook(当然你在terminal 里执行也没问题)。

如下箭头所示,点击即可创建一个新的 Notebook 页面。

2、克隆LLaMA-Factory

(如果使用本地电脑进行微调,以下步骤都可参考)

打开NoteBook的终端,在默认目录(/mnt/workspace/)下执行命令:

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

建议使用--depth 1参数,将data及一些示例的训练数据下载下来,以便修改微调。

3、配置环境

3.1、创建虚拟环境

进入LLaMA-Factory目录:

cd LLaMA-Factory/

创建虚拟环境:

python -m venv env  # env为虚拟环境文件夹名称,可自定义,如llama-factory-env

激活虚拟环境:NoteBook终端是linux系统,激活虚拟环境命令如下(同macOS):

source env/bin/activate # env为创建的虚拟环境名称

如果是windows系统,使用如下命令激活虚拟环境:

env\Scripts\activate

注意:重启NoteBook后,记得先激活虚拟环境!

3.2、安装依赖

安装必要的依赖,如:

pip install --upgrade pip     # 更新pip
pip install bitsandbytes>=0.39.0 

3.3、安装LLaMA-Factory

使用以下命令安装:

pip3 install -e ".[torch,metrics]"

4、模型下载测试

4.1、下载模型

首先下载LLM大语言模型,这里使用QWen2.5-0.5B,参数5亿个,微调时间短,在低配置电脑上也能运行。

模型在魔搭社区上有,地址是:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/81225.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python 3.13.3 安装教程

原文来自:Python 3.13.3 安装教程 | w3cschool笔记 (请勿标记为付费!!!) Python 是一种广泛使用的编程语言,广泛应用于 Web 开发、科学计算、数据处理、人工智能等领域。Python 3.13.3 作为 P…

sqli-labs靶场29-31关(http参数污染)

目录 前言 less29(单引号http参数污染) less30(双引号http参数污染) less31(双引号括号http参数污染) 前言 在JSP中,使用request.getParameter("id")获取请求参数时,如果存在多个同名参数&a…

npm cross-env工具包介绍(跨平台环境变量设置工具)

文章目录 cross-env:跨平台环境变量设置工具什么是cross-env?为什么需要cross-env?平台差异带来的问题 cross-env的工作原理核心功能技术实现 安装与基本使用安装步骤基本使用方法运行效果 高级使用技巧设置多个环境变量环境变量传递与链式命…

mac docker弹窗提示Docker 启动没有响应

一、原因分析 这台笔记电脑是Mac M3操作系统,安装Docker之后,Docker应用程序一直启动不起来。 二、解决办法 sudo rm /Library/PrivilegedHelperTools/com.docker.vmnetd sudo cp /Applications/Docker.app/Contents/Library/LaunchServices/com.docker.vmnetd /Library/Pri…

Golang基础知识—cond

cond 通常指 sync.Cond,它是标准库 sync 包中用于实现 条件变量 的同步原语。条件变量在多 goroutine 协作场景中非常有用,尤其在需要根据特定条件协调多个 goroutine 的执行顺序时。 sync.Cond 的核心作用 条件变量用于 等待某个条件满足 或 通知其他等…

MySQL 8.0 OCP 1Z0-908 题目解析(1)

题目001 Choose two. User fwuserlocalhost is registered with the SQL Enterprise Firewall and has been granted privileges for the sakila database. Examine these commands that you executed and the results: mysql> SELECT MODE FROM INFORMATION_SCHEMA.SQL…

【Tools】git使用详解以及遇到问题汇总

这里写目录标题 安装git安装 TortoiseGitgit github gitlab, Gitee 区别visual studio中使用gitgit使用步骤git命令git删除某些历史提交记录git找回丢失代码git上传文本和二进制和gitignore删除文件删不掉的问题 安装git https://blog.csdn.net/mukes/article/details/1156938…

画立方体软件开发笔记 js-pytorch xlsx 导出 excel pnpm安装

js-pytorch npm install -g pnpm pnpm add js-pytorch 放着,等我把模型训练好了再用这个对接 xlsx pnpm install xlsx ai写代码,一遍就通了 import * as XLSX from "xlsx"; import { linelist } from ./2dviewport.js; function export…

Kotlin并发请求的一些知识记录

private suspend fun fetchDataConcurrently(list: MutableList<MyType>,onRequestResult: (Int, List<MyType>?) -> Unit //高阶函数回调) {val deferredList mutableListOf<Deferred<MyType?>>()// 设定任务超时时间为12秒&#xff0c;并使用 …

配置VScodePython环境Python was not found;

Python was not found; run without arguments to install from the Microsoft Store, or disable this shortcut from Settings > Manage App Execution Aliases. 候试试重启电脑。 在卸载重装python后会出现难以解决的局面&#xff0c;系统变量&#xff0c;命令行&#…

OracleLinux7.9-ssh问题

有套rac环境&#xff0c;db1主机无法ssh db1和db1-priv&#xff0c;可以ssh登录 db2和db2-priv [rootdb1 ~]# ssh db1 ^C [rootdb1 ~]# ssh db2 Last login: Wed May 14 18:25:19 2025 from db2 [rootdb2 ~]# ssh db2 Last login: Wed May 14 18:25:35 2025 from db1 [rootdb2…

如何创建maven项目

1.IDEA 中创建 Maven 项目 步骤一&#xff1a;点击 File -> New -> Project&#xff0c;在弹出的窗口左侧选择 Maven&#xff0c;点击 Next&#xff1a; 步骤二&#xff1a;填写项目的 GroupId、ArtifactId、Version 等信息&#xff08;这些对应 pom.xml 中的关键配置&am…

Python爬虫实战:研究ajax异步渲染加密

一、引言 在当今数字化时代,数据已成为推动各行业发展的核心驱动力。网络爬虫作为一种高效的数据采集工具,能够从互联网上自动获取大量有价值的信息。然而,随着 Web 技术的不断发展,越来越多的网站采用了 AJAX(Asynchronous JavaScript and XML)异步渲染技术来提升用户体…

沪深股指期货指数怎么参考交易?

沪深股指期货指数&#xff0c;其实它就是咱们炒股时的一个“风向标”和“工具箱”。今天咱们就来聊聊怎么参考这个指数来交易&#xff0c;让你也能轻松上手&#xff01; 一、沪深股指期货指数是啥&#xff1f; 沪深股指期货指数&#xff0c;简单来说&#xff0c;就是基于沪深…

演员评论家算法

一、演员评论家算法核心思想和原理 演员(actor)代表策略&#xff0c;评论家代表价值函数。演员评论家算法是基于价值和策略的综合性方法。具体来说该算法使用了策略梯度和时序差分方法&#xff0c;是二者的一种有机结合。 1. 主要思想 策略梯度算法以轨迹为单位更新&#xf…

PyCharm 快捷键指南

PyCharm 快捷键指南 常用编辑快捷键 代码完成&#xff1a;Ctrl Space 提供基本的代码完成选项&#xff08;类、方法、属性&#xff09;导入类&#xff1a;Ctrl Alt Space 快速导入所需类语句完成&#xff1a;Ctrl Shift Enter 自动结束代码&#xff08;如添加分号&#…

计算图存储采用矩阵吗,和张量关系

计算图存储采用矩阵吗,和张量关系 计算图的存储方式与张量的关系 一、计算图的存储方式 计算图(Computational Graph)是一种用于描述数学运算的有向无环图(DAG),其节点代表运算(如加减乘除、矩阵乘法、激活函数等),边代表运算的输入和输出(通常是张量)。计算图的…

RDD中分区、分区器及自定义分区器的学习

深入理解 Spark 中 RDD 分区与分区器&#xff1a;原理、应用及自定义实现 在大数据处理领域&#xff0c;Apache Spark 凭借其高效的分布式计算能力成为了众多开发者的首选框架。在 Spark 中&#xff0c;弹性分布式数据集&#xff08;Resilient Distributed Dataset&#xff0c…

OpenCV CUDA 模块中用于在 GPU 上计算矩阵中每个元素的绝对值或复数的模函数abs()

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 void cv::cuda::abs(InputArray src, OutputArray dst, Stream &stream Stream::Null()) 是 OpenCV 的 CUDA 模块中的一个函数&#xff0c;…

FramePack - 开源 AI 视频生成工具

&#x1f3ac; 项目简介 由开发者 lllyasviel 创建的一个轻量级动画帧处理工具库&#xff0c;专门用于游戏开发、动画制作和视频处理中的帧序列打包与管理。该项目采用高效的算法实现&#xff0c;能够显著提升动画资源的处理效率。 此 AI 视频生成项目&#xff0c;旨在通过低显…