个人或企业做网络贸易的主要网站企业信用信息查询公示系统网址

news/2025/9/26 7:37:54/文章来源:
个人或企业做网络贸易的主要网站,企业信用信息查询公示系统网址,公司网站做百度推广需要交费吗,手机网站底部导航ChatGLM2-6B介绍#xff1a; 介绍 ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本#xff0c;在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上#xff0c;ChatGLM2-6B 引入了如下新特性#xff1a; 更强大的性能#xff1a;基于 ChatGLM 初…ChatGLM2-6B介绍 介绍 ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上ChatGLM2-6B 引入了如下新特性 更强大的性能基于 ChatGLM 初代模型的开发经验我们全面升级了 ChatGLM2-6B 的基座模型。ChatGLM2-6B 使用了 GLM 的混合目标函数经过了 1.4T 中英标识符的预训练与人类偏好对齐训练评测结果显示相比于初代模型ChatGLM2-6B 在 MMLU23%、CEval33%、GSM8K571% 、BBH60%等数据集上的性能取得了大幅度的提升在同尺寸开源模型中具有较强的竞争力。更长的上下文基于 FlashAttention 技术我们将基座模型的上下文长度Context Length由 ChatGLM-6B 的 2K 扩展到了 32K并在对话阶段使用 8K 的上下文长度训练。对于更长的上下文我们发布了 ChatGLM2-6B-32K 模型。LongBench 的测评结果表明在等量级的开源模型中ChatGLM2-6B-32K 有着较为明显的竞争优势。更高效的推理基于 Multi-Query Attention 技术ChatGLM2-6B 有更高效的推理速度和更低的显存占用在官方的模型实现下推理速度相比初代提升了 42%INT4 量化下6G 显存支持的对话长度由 1K 提升到了 8K。更开放的协议ChatGLM2-6B 权重对学术研究完全开放在填写[问卷](https://open.bigmodel.cn/mla/form)进行登记后**亦允许免费商业使用**。 代码托管的githubhttps://github.com/THUDM/ChatGLM-6B 先将代码下载到本地 可以使用git git clone https://github.com/THUDM/ChatGLM2-6B 或者直接将GitHubzip包下载到本地然后解压 Multi-Query Attention 同时也降低了生成过程中 KV Cache 的显存占用此外ChatGLM2-6B 采用 Causal Mask 进行对话训练连续对话时可复用前面轮次的 KV Cache进一步优化了显存占用。因此使用 6GB 显存的显卡进行 INT4 量化的推理时初代的 ChatGLM-6B 模型最多能够生成 1119 个字符就会提示显存耗尽而 ChatGLM2-6B 能够生成至少 8192 个字符。 量化等级编码 2048 长度的最小显存生成 8192 长度的最小显存FP16 / BF1613.1 GB12.8 GBINT88.2 GB8.1 GBINT45.5 GB5.1 GB 然后去huggingface去下载模型文件 https://huggingface.co/THUDM/chatglm2-6b 这个是FP16的站显存比较大 我们选择INT-4 https://huggingface.co/THUDM/chatglm2-6b-int4/tree/main 然后将文件下载到本地注意huggingface需要翻墙现在国内无法登陆 下载zip解压到本地然后创建一个model的文件存放模型文件这是我下载到本地的文件 本地下载的模型文件 然后启动pycharm导入这个项目 修改模型加载地址打开web_demo.py文件 然后使用 pip 安装依赖 pip install -r requirements.txt其中 transformers 库版本推荐为 4.30.2torch 推荐使用 2.0 及以上的版本以获得最佳的推理性能。 我是测试CPU运行所以还要改一些地方我这边选择的是chatglm2-6b-int4 CPU 部署 如果你没有 GPU 硬件的话也可以在 CPU 上进行推理但是推理速度会更慢。使用方法如下需要大概 32GB 内存 model AutoModel.from_pretrained(THUDM/chatglm2-6b, trust_remote_codeTrue).float()如果你的内存不足的话也可以使用量化后的模型 model AutoModel.from_pretrained(THUDM/chatglm2-6b-int4,trust_remote_codeTrue).float()在 cpu 上运行量化后的模型需要安装 gcc 与 openmp。多数 Linux 发行版默认已安装。对于 Windows 可在安装 TDM-GCC 时勾选 openmp。 Windows 测试环境 gcc 版本为 TDM-GCC 10.3.0 Linux 为 gcc 11.3.0。 如果不安装  TDM-GCC 会报错安装TDM-GCC如果不选openmp会报错 TDM-GCC g: error: libgomp.spec: No such file or directory 注意要勾选TDM-GCC的安装过程 安装好了。 运行还会报错 Traceback (most recent call last):   File H:\Model\ChatGLM2-6B\web_demo.py, line 89, in module     user_input gr.Textbox(show_labelFalse, placeholderInput..., lines10).style( AttributeError: Textbox object has no attribute style 解决gradio安装3.40.0 pip install gradio3.40.0  ChatGLM2-6B有三中方式实现交互 web_demo.py 是 gradio测试网页版本 启动命令python web_demo.py web_demo2.py是命令启动基于 Streamlit 的网页版 demo 启动命令 streamlit run web_demo2.py cli_demo.py 是程序会在命令行中进行交互式的对话在命令行中输入指示并回车即可生成回复输入 clear 可以清空对话历史输入 stop 终止程序。 启动命令 python cli_demo.py 然后运行python web_demo.py 然后可以开始对话了但是特别的卡主要是我的配置太低了 半天就刷出来这几个字哈哈 测试 web_demo2.py ​ ​  测试cli_demo.py ​  在安装显卡驱动的前提下显卡驱动安装方法输入 nvidia-smi ​  可以看到该电脑可以支持的cuda版本最高是12.2驱动是向下兼容的所以cuda版本小于等于12.2的都可以安装上。 先安装CUDA的一个版本我们先要安装cudacuda11.7是稳定版本cuda12.1是预览版本但是不稳定。所以我们安装CUDA11.7 官网CUDA cmd查看是否安装成功 nvcc -V  cudnn下载cudnn官网  GPU运行会提示错误 AssertionError: Torch not compiled with CUDA enabled 主要是安装的torch不支持GPU导致的我们先把torch卸载掉然后下载和GPU相匹配的torch pip uninstall torch 然后下载和torch对应支持的cuda版本 pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117  ​ 安装成功了我们测试一下 ​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/917948.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站被黑了多久恢复wordpress 文章免审核

值转换器 valueconvert 使用ValueConverter需要实现IValueConverter接口,其内部有两个方法,Convert和ConvertBack。我们在使用Binding绑定数据的时候,当遇到源属性和目标控件需要的类型不一致的,就可以使用ValueConverter&#xf…

网站图标怎么设置建筑公司需求发布网站

SSE是server-sent events协议简称,SSE协议主要是依托于HTTP链接用来从服务端将消息、信息、事件推动给客户端的协议。 SSE简介 SSE最近突然的被很多人关注还有一个主要原因就是ChatGPT等大模型的聊天类系统就采用了SSE协议。在使用ChatGPT的时候,输入Prompt后的反馈是逐渐的…

邯郸网站设计公司排名wordpress 显示微博

大家好,我是『芯知识学堂』的SingleYork,前面给大家简单介绍了『开源项目』基于STM32的智能垃圾桶之成员简介,相信有很多小伙伴都已经忍不住跃跃欲试了,别着急,从这一篇开始,笔者将会带领大家一步一步来完成…

假如电脑的服务器关闭后做的网站还能打开吗logo在线设计生成免费

众所周知,验证码在我们的生活中都是非常常见的,很多公司都在各种折腾各种各样的验证码,这里简要的用一个小案例来实现验证码的功能(ps:其实我挺讨厌验证码这个东西的)。 建立一个javaweb工程,新建login.htm…

深圳微商城网站制作报价网站怎么建设以及维护

戳蓝字“CSDN云计算”关注我们哦!极客头条:速递、最新、绝对有料。这里有企业新动、这里有业界要闻,打起十二分精神,紧跟fashion你可以的!1975年4月4日,是历史上普通的一天。这一天,有两个人成立…

有关网站开发的国外书籍中国肩章

今天和大家一起探讨权限管理方面的设计心得。权限管理,是B端后台系统一个重要的组成部分,属于底层的支撑功能,系统内所有的功能,甚至字段的增减都涉及到权限的分配和管理。因此怎样配置后台的权限系统,以适应多变业务需…

南昌专业的电商网站开发公司新公司注册详细流程

作者| 沉默王二责编| Carol封图| CSDN│下载于视觉中国从 10 年前我开始写第一行 Java 代码至今,一直觉得 null 在 Java 中是一个最特殊的存在,它既是好朋友,可以把不需要的变量置为 null 从而释放内存,提高性能;它又是…

专营网站建设长安网站建设价格

目录 1.K8s什么要使用Ingress 2.在本地K8s集群安装Nginx Ingress controller 2.1.使用Kind创建本地集群 2.1.1.创建kind配置文件 2.1.2.执行创建命令 2.2.找到和当前k8s版本匹配的Ingress版本 2.2.1.查看当前的K8s版本 2.2.2.在官网中找到对应的合适版本 2.3.按照版本安…

对单位网站建设的意见wordpress主菜单导航插件

今天的分享将围绕一个大家再熟悉不过的名称展开——浏览器。 根据百科给出的解释:浏览器是用来检索、展示以及传递Web信息资源的应用程序。通俗的说,浏览器就是一种阅读工具,类似记事本、word、wps,只不过后者阅读的是文本文档&am…

怎么制作免费建网站网站数据采集怎么做

一、进程间通信原理: 1、通信是有成本的:两个或者多个进程,实现数据层面的交互,因为进程独立性的存在,导致进程通信的成本比较高。 2、进程间通信的方式: ①基本数据 ②发送命令 ③某种协同 ④通知 .....…

asp做网站计数器网站如何收费

提示:文章 文章目录 前言一、背景二、 2.1 2.2 总结 前言 前期疑问: 本文目标: 一、背景 最近 std::pair和std::tuple 二、用法 1.1 创建 看代码规范,提到:通过std::pair 和std::tuple ,函数可以同…

如何给网站添加cnzzdns 部分网站打不开

MySQL是一种流行的关系型数据库管理系统,其中WHERE子句是用于过滤数据的重要部分。通过使用WHERE子句,可以根据指定的条件从表中选择特定的数据行。本文将总结MySQL WHERE子句的使用和优化方法,帮助读者更好地理解和应用WHERE子句&#xff0c…

北京专业制作网站公司佛山企业网站建设公司

如何彻底删除node和npm 前言: 最近做个项目把本地的node更新了,之前是v10.14.2更新至v16.14.0 ,想着把之前的项目起来下,执行npm install 结果启动不了,一直报npm版本不匹配需要更新本地库异常… 找了几天发现是npm 和…

网站建设的销售好做吗网络哪个公司好

https://adworld.xctf.org.cn/contest/list?rwNmOdr1697354606875 目录 请求数据参数加密 cookie加密 响应数据解密 代码 请求数据参数加密 我们可以根据请求的关键字qmze1yzvhyzcyyjr获取到对应的加密地方 可以看到使用了函数_0x1dc70进行了加密 cookie加密 该步骤需…

做美工用什么素材网站门户网站维护怎么做

在我们使用电脑的时候有时候要对系统进行还原,那么你知道如何进行系统还原吗?不知道的小伙伴一起来操作一遍吧。 1 第一步 鼠标单击左下角的开始菜单,选择设置,进入页面 如何进行系统还原 2 第二步 单击更新和安全,选择左侧的恢…

长春网站快照优化公司vpswindows野外大全

介绍 希尔排序属于那种没有了解过的直接看代码一脸懵逼的, 所以同学们尽量不要直接看代码,仔细阅读本篇博客内容。 插入排序本来算是一个低效排序, 一次只可以挪动一个数据, 但是,它的强来了!&#xff01…

网站开发前途塘沽网站建设优化

目录 一、部署PXE远程安装服务 1. 系统装机的三种引导方式 2. pxe概述 3. 实现过程 4. 搭建过程中服务介绍 4.1 TFTP服务 4.2 vsftp:安装系统镜像文件获取方式 4.3 syslinux 4.4 DHCP服务 5. 操作过程 二、实现Kickstart无人值守安装 1. 安装Kickstart图…

Java 与交通科技:智慧交通与自动驾驶实践

一、引言 交通运输作为社会运行的重要支撑,正经历从 信息化 到 智能化 的深度变革。智慧交通系统(ITS)与自动驾驶技术的发展,使得交通管理更高效、出行体验更便捷、安全性也显著提升。 在这一进程中,Java 作为全球…

商机互联做网站怎么样中国万网张向东

Advanced REST Client是 Chrome 浏览器下的一个插件,通过它可以发送 http、https、WebSocket 请求。在 Chrome 商店下搜索 Advanced REST Client,即可找到如果搜索不到的可到CSDN 下载:1.下载插件:Advanced Rest Client2.因为最新…

成都响应网站建设wordpress文字围绕图片

DevExpress WPF Diagram(流程图)控件帮助用户完美复制Microsoft Visio UI,并将信息丰富且组织良好的图表、流程图和组织图轻松合并到您的下一个WPF项目中。 P.S:DevExpress WPF拥有120个控件和库,将帮助您交付满足甚至…