整站seo技术wordpress 文章 置顶

web/2025/9/25 20:40:04/文章来源:
整站seo技术,wordpress 文章 置顶,建网站用什么系统好,网站开发建设书籍推荐在《Win10本地部署大语言模型ChatGLM2-6B-CSDN博客》基础上进行#xff0c;官方文档在这里#xff0c;参考了这篇文章 首先确保ChatGLM2-6B下的有ptuning AdvertiseGen下载地址1#xff0c;地址2#xff0c;文件中数据留几行 模型文件下载地址 #xff08;注意#xff1…在《Win10本地部署大语言模型ChatGLM2-6B-CSDN博客》基础上进行官方文档在这里参考了这篇文章 首先确保ChatGLM2-6B下的有ptuning AdvertiseGen下载地址1地址2文件中数据留几行 模型文件下载地址 注意ChatGLM2-6B对话用到的的模型文件不能简单的用到这里bin文件可以复用但其他文件一定要重新下载否则要报一些错) anaconda prompt中运行进行虚拟环境 cd /d D:\openai.wiki\ChatGLM2-6B conda activate D:\openai.wiki\ChatGLM2-6B\ENV 运行微调除 ChatGLM2-6B 的依赖之外还需要安装以下依赖 pip install rouge_chinese nltk jieba datasets 先了解一下train.sh(仅在Linux中使用)里面各行的意义 PRE_SEQ_LEN128 # soft prompt 长度 LR2e-2 # 训练学习率 NUM_GPUS2 # GPU卡的数量torchrun --standalone --nnodes1 --nproc-per-node$NUM_GPUS main.py \--do_train \ # 执行训练功能还可以执行评估功能--train_file AdvertiseGen/train.json \ # 训练文件目录--validation_file AdvertiseGen/fval.json \ # 验证文件目录--prompt_column content \ # 训练集中prompt提示名称对应训练文件测试文件的content--response_column summary \ # 训练集中答案名称对应训练文件测试文件的summary--overwrite_cache \ # 缓存重复训练一次的时候可删除--model_name_or_path THUDM/chatglm-6b \ # 加载模型文件目录也可修改为本地模型的路径--output_dir output/adgen-chatglm-6b-pt-$PRE_SEQ_LEN-$LR \ # 保存训练模型文件目录--overwrite_output_dir \ # 覆盖训练文件目录--max_source_length 64 \ # 最大输入文本的长度--max_target_length 128 \--per_device_train_batch_size 1 \ # batch_size 训练批次根据显存调节--per_device_eval_batch_size 1 \ # 验证批次--gradient_accumulation_steps 16 \ # 梯度累加的步数--predict_with_generate \--max_steps 3000 \ # 最大训练模型的步数--logging_steps 10 \ # 多少步打印日志一次--save_steps 1000 \ # 多少步保存模型一次--learning_rate $LR \ # 学习率--pre_seq_len $PRE_SEQ_LEN \--quantization_bit 4 # 量化也可修改为int8Windows下用以下的train.bat 因我的电脑显存只有8G故将per_device_train_batch_size改为8 去掉--quantization_bit 4 set PRE_SEQ_LEN128 set LR1e-4python main.py ^--do_train ^--train_file AdvertiseGen/train.json ^--validation_file AdvertiseGen/dev.json ^--preprocessing_num_workers 10 ^--prompt_column content ^--response_column summary ^--overwrite_cache ^--model_name_or_path D:\\openai.wiki\\ChatGLM2-6B\\ptuning\\THUDM\\chatglm2-6b ^--output_dir D:/openai.wiki/ChatGLM2-6B/ptuning/output ^--overwrite_output_dir ^--max_source_length 64 ^--max_target_length 128 ^--per_device_train_batch_size 8 ^# batch_size 训练批次根据显存调节--per_device_eval_batch_size 1 ^--gradient_accumulation_steps 16 ^--predict_with_generate ^--max_steps 3000 ^--logging_steps 10 ^--save_steps 1000 ^--learning_rate %LR% ^--pre_seq_len %PRE_SEQ_LEN% 进入ptuning文件夹 cd ptuning 运行train.bat即可开始训练有问题的话继续往后看 train.bat 可能遇到的几个问题 问题一 TypeError: JsonConfig.init() got an unexpected keyword argument use_auth_token’ 解决方式 pip uninstall datasets pip install datasets2.21.0 问题二 name ‘round_up‘ is not defined 解决方式 将train.bat中的–quantization_bit 4删除 或者pip install cpm_kernels 问题三 AttributeError: ‘ChatGLMModel‘ object has no attribute ‘prefix_encoder‘ 解决方式 https://huggingface.co/THUDM/chatglm2-6b/tree/main 下载除bin文件以外的最新文件

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/81812.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

有电脑网站怎么做手机网站宣传软文是什么意思

数据库备份工具(实现数据定时覆盖) 永远热爱,永远执着! 工具介绍 自动化测试数据库更新调度程序 这段 Python 脚本自动化了每天定时从生产数据库更新测试数据库的过程。它利用了 schedule 库来安排并执行每天指定时间的更新任务…

福建工程建设网站seosem是什么职位

目录 友情提醒第一章、数据库简述1.1)数据库简述1.2)常见的数据库软件1.3)MySQL数据库安装 第二章、SQL语句分类2.1)操作数据仓库/数据表:DDL2.1.1)创建数据仓库/数据表2.1.2)删除数据仓库/数据表2.1.3&…

全国建设工程信息网站百度精准推广

git add命令 作用:移动文件:工作区-->暂存区 git add .:把所有文件都放到暂存区 git commit命令 作用:移动文件:暂存区-->本地仓库 git status命令 作用:查看修改状态 git log命令 作用&#xf…

精益生产网站开发方案建立公司网站需要多少钱

模型-视图-控制器(MVC)是80年代Smalltalk-80出现的一种软件设计模式,现在已经被广泛的使用。1、模型(Model)模型是应用程序的主体部分。模型表示业务数据,或者业务逻辑.2、视图(View)视图是应用程序中用户界面相关的部分,是用户看到并与之交互…

网站建设 网站内容 采集交易网站建设需要学什么软件

问题提出: 系统状态不稳定,需要排查原因,所以需要监视所有进程的资源,以及进程是那个程序(有些进程名写的一样,需要根据PID查看是哪个执行文件) 方法: 1. 使用subprocess函数&…

宁波公司建网站哪家好北辰天津网站建设

要测试网盘或服务器的上传,下载速度,需要指定大小的文件用来测试。创建的空白文件虽然没有任何内容,但是有大小,可以用来测试实际传输速度、覆盖已删除数据等用途。这篇文章是本站教大家在Win10中用命令或WSL创建任意大小空白文件…

宁夏中卫市林业生态建设局网站电子商务网站功能设计

《Linux操作系统原理分析》(2) 2 Linux概述2.1 Linux发展史2.2 Linux与GNC 2.3 Linux性能2.4 Linux 技术特点 2 Linux概述 2.1 Linux发展史 年份事件1991年22岁的荷兰大学生 Linus B.Torvalds 在 PC 机上开发出简单的操作系统内核程序。1994 年 3 月Li…

网站内链规划企业宣传片制作公司天津

文章目录 1. Docker简介2. Docker环境安装Linux安装 3. 配置镜像加速4. Docker镜像常用命令列出镜像列表搜索镜像下载镜像查看镜像版本删除镜像构建镜像推送镜像 5. Docker容器常用命令新建并启动容器列出容器停止容器启动容器进入容器删除容器(慎用)查看…

暖色网站模板做网站需要空间跟域名吗

【Educoder数据挖掘实训】插值填充法处理遗漏值 开挖 这关的介绍非常详细,只要看懂了基本就没有问题。 所谓插值其实就是根据已有的数据构造出函数,然后用这个函数来计算遗漏的数据。 比如这个题目中介绍的拉格朗日插值以及 K K K近邻。 有关拉格朗日插值…

网站建设的总体需求专门做书籍设计的网站

Java 8与往常一样是妥协和向后兼容的版本。 JSR-335专家组可能无法与某些读者就某些功能的范围或可行性达成一致的发行版。 请参阅Brian Goetz关于为什么…的一些具体解释。 …Java 8默认方法中不允许“最终” …Java 8默认方法中不允许“同步” 但是今天,我们将…

百度网站如何建设中国室内设计网站有哪些

首先,来看下效果图 在线体验地址:https://geojson.hxkj.vip,并提供实时geoJson数据文件下载 可下载的数据包含省级geojson行政边界数据、市级geojson行政边界数据、区/县级geojson行政边界数据、省市区县街道行政编码四级联动数据&#xff0…

做网站数据存在哪里别人在百度冒用公司旗号做网站

概述 npm(Node Package Manager)是一个JavaScript编程语言的包管理器,用于Node.js应用程序。它允许用户安装、共享和管理具有重复使用价值的代码(包),这些代码可以是库、工具或应用程序。 npm常用命令详解…

网站建设公司自适应源码顺企网上海网站建设

macOs系统安装软件的疑问 所有问题mac系统文件结构我用mac安装软件,不用像windows一样创建文件夹吗只能安装到Applications文件夹吗安装程序的指南和提供的安装选项是什么软件安装在Applications下的/appName文件夹,它的所有数据都会在该文件夹吗如果卸载…

网站建设的项目方案网站分站程序

jsf 项目上周有一篇很棒的stackoverflow博客文章,主题是“ Javascript框架的残酷生命周期” 。 这篇文章是关于Javascript UI框架(angularjs,angular,jquery和react)的流行和流行的速度。 这篇文章的关键指标是每月关于…

网站建设公司广告语深圳网站建设最专

直接上效果图: 代码仓库和视频演示b站视频005期: 到此一游7758258的个人空间-到此一游7758258个人主页-哔哩哔哩视频 代码展示: 数据集在datasets文件夹下 运行01train.py即可训练 训练结束后会保存模型在本地 运行02pyqt.py会有一个可视化…

网站建设综合实训心得体会张梅 合肥网站建设

3D 管道设计软件是大多数行业工程工作的主要部分,例如: 电力、石油和天然气、石化、炼油厂、纸浆和造纸、化学品和加工业。 全球各工程公司使用了近 50 种工厂或管道设计软件。 每个软件都有优点和缺点,包括价格点。 EPC 和业主部门当前的趋势…

网站收录提交工具新注册建筑公司名称大全

目录 1.介绍 2.模板传参 1.变量传参 2.表达式 3.控制语句 4.过滤器 5.自定义过滤器 6.测试器 7.块和继承 flask基础1 1.介绍 Jinja2:是Python的Web项目中被广泛应用的模板引擎,是由Python实现的模板语言,Jinja2 的作者也是 Flask 的作 者。他的设计思想来源于Django的模…

网站设计常州网监备案网站更换域名

一 什么是网关?为什么选择 Gateway? 网关功能如下: 身份认证和权限校验服务路由、负载均衡请求限流 在 Spring Cloud 中网关的实现包含两种: Gateway(推荐):是基于 Spring5 中提供的 WebFlux &#xff…

响应式网站开发步骤如何让自己做的网页有网站

实在受不了了,只好出来说两句。好歹也是数学这一行的,看她被你们糟蹋成这样实在不忍心。“无穷大量”和“无穷小量”在高等数学中都是趋于特定极限的变量的称呼,一个变量在某一极限过程中趋于无穷大(小),那么此变量称为“无穷大(小…

做的网站如何全屏丽江建设局网站

双显示器设置:如何设置一台电脑两个显示器 -来源:互联网 作者:佚名 时间:04-11 09:00:18 【大 中 小】 点评:双显示器设置,如何设置一台电脑两个显示器:一般来说一台电脑通常只配一个显示器,在我…