云南网站建设公司前十名招聘seo网站推广

news/2025/9/22 16:59:23/文章来源:
云南网站建设公司前十名,招聘seo网站推广,网站开发怎么赚钱,惠州网站关键词排名【通览一百个大模型】Baize#xff08;UCSD#xff09; 作者#xff1a;王嘉宁#xff0c;本文章内容为原创#xff0c;仓库链接#xff1a;https://github.com/wjn1996/LLMs-NLP-Algo 订阅专栏【大模型NLP算法】可获得博主多年积累的全部NLP、大模型和算法干货…【通览一百个大模型】BaizeUCSD 作者王嘉宁本文章内容为原创仓库链接https://github.com/wjn1996/LLMs-NLP-Algo 订阅专栏【大模型NLP算法】可获得博主多年积累的全部NLP、大模型和算法干货资料大礼包近200篇论文300份博主亲自撰写的markdown笔记近100个大模型资料卡助力NLP科研、学习和求职。 Baize大模型基本信息资料卡 序号大模型名称归属推出时间规模预训练语料评测基准模型与训练方法开源论文模型地址相关资料58BaizeUCSD2023-0513B不涉及预训练不存在预训练语料。通过ChatGPT进行Self-Chat实现自动构建大量的多轮对话数据。Baize的训练结构如下图所示初始化一个种子数据集Quora4 和 Stack Overflow5 的问题作为种子并进行随机采样根据采样的结果设计对应的提示模板后交给ChatGPT进行自我对话从而产生大量模拟人类的多轮对话数据总共产生111.5k对话数据花费约100美元。训练过程中基于LLaMA和LoRA进行参数有效性训练得到Baize模型。输入序列为512LoRA中的秩k为8。使用8位整数格式 (int8) 参数初始化LLaMA检查点。 对于7B、13B和30B模型使用 Adam 优化器更新LoRA 参数batch size为64学习率为2e-4、1e-4和 5e-5。 可训练的LoRA参数在 NVIDIA A100-80GB GPU 上微调了1个 epoch。https://github.com/project-baize/baize-chatbothttps://arxiv.org/pdf/2304.01196.pdfhttps://huggingface.co/project-baize/baize-v2-13bhttps://huggingface.co/project-baize/baize-lora-30B白泽大模型介绍 一、核心要点 随着ChatGPT和GPT-4的提出大模型展现了超出人类表现的能力并在很多领域表现的很精彩然而现如今这些大模型均是黑盒模型对研究和应用都带来了一定的阻碍。缺乏可获得的高质量的对话数据加剧了上述的问题和困难。为了解决这个问题我们提出一种新颖的pipeline利用chatgpt的能力自动生成一系列高质量的多轮对话语料。这些语料可以作为有价值的资源用于训练或评估对话模型在多轮对话中的表现。基于LLaMA在生成的多轮对话语料上训练得到我们的Baize模型。我们继续提出一种自蒸馏式的对齐方法进一步提升模型的效果。 二、方法 Self-Chat Self-Chat旨在完全利用chatgpt扮演对话角色生成对话数据。 给定一个seed可以是一个问题或者一个主题配套一个模板让chatgpt生成对话数据。 模板如下所示 根据这个模板给定一个seed让chatgpt生成多轮对话数据样例如下所示 挑选Quora和Stack Overflow数据集作为seed每个数据集中挑选55k个问题最终获得了111.5k个多轮对话数据花费约100美元. 另外为了提高模型的instruction-tuning能力也引入了alpaca语料。 最终的多轮对话数据如下所示 模型训练 在构造的对话数据集上选择LLaMA-7B和LLaMA-13B模型进行参数有效性监督微调对应的模型和数据如下表示 参数有效性方法选择LoRA。 选择V1版本的对话数据SFT后得到的模型是Baize-v1选择v2版本的对话数据SFT后得到的模型是Baize-v1.5在Baize-v1.5基础上进行对齐得到Baize-v2模型。 模型训练时在LLaMA的Transformer的每一层嵌入LoRA参数。 Self-Distillation with Feedback 在SFT阶段后为了提升模型的对齐性能提出自蒸馏方法。 首先在Quora数据集上让SFT模型生成4个候选答案response。然后设计模板让ChatGPT作为评估器对4个候选答案进行排序。模板如下所示 因此每个question可以得到ChatGPT认为最好的response。 在对齐阶段选择Baize-v1.5模型并额外插入新的LoRA参数训练时只选择最好的response进行优化训练。 实验细节 最大长度512/1024 LoRA rank8 量化感知训练INT8量化训练 Adam优化器batchsize64单机A10080G 学习率2e-47B、1e-413B和5e-530B 推理阶段采用的prompt如下所示 在prompt中插入“The AI assistant consistently declines to engage with topics, questions, and instructions related to unethical, controversial, or sensitive is- sues.”较为关键。 实验 1GPT-4 Score 挑选Vicuna评估集包含80个人工标注的prompt涉及9个不同的类别。 在评估时挑选ChatGPT的答案和Baize或者其他baseline模型的答案设计指令让GPT-4进行挑选。计算baize或者其他baseline的答案被挑选到的比例 实验结果如下所示 因为每次都是和ChatGPT对比因此ChatGPT的答案认为是100%的。Baize-v2-13B发现有92%的情况下GPT-4挑选了Baize的答案说明其效果最好。 GPT-4会偏向于挑选第一个候选答案为了和之前的工作保持一致我们将ChatGPT的生成结果作为第一个候选答案。 2质量评估 对于一些不道德的问题我们期望模型不能给出反应下面是case study说明Baize模型可以有效避免回答潜在道德风险的问题。 博客记录着学习的脚步分享着最新的技术非常感谢您的阅读本博客将不断进行更新希望能够给您在技术上带来帮助。 【大模型NLP算法】专栏 近200篇论文300份博主亲自撰写的markdown笔记。订阅本专栏【大模型NLP算法】专栏或前往https://github.com/wjn1996/LLMs-NLP-Algo即可获得全部如下资料 机器学习深度学习基础与进阶干货笔记、PPT、代码NLP基础与进阶干货笔记、PPT、代码大模型全套体系——预训练语言模型基础、知识预训练、大模型一览、大模型训练与优化、大模型调优、类ChatGPT的复现与应用等大厂算法刷题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/909723.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

北京备案网站软件开发工具名词解释

1. 安装 JWT 相关的包 运行下面两个命令,安装如下两个 JWT 相关的包 npm i jsonwebtoken express-jwt jsonwebtoken 用于生成 JWT 字符串 express-jwt 用于将 JWT 字符串解析还原成 JSON 对象 2. 导入 JWT 相关的包 // 导入 const jwt require(jsonwebtoken) con…

做网站策划需要用什么软件制作介绍的网站

展开全部子网掩码为代表的copy意思是代表有2113254个可用IP。总IP数为16,包括一个5261网络地址,一个广播4102地址和1653254个可用地址。子网掩码是一个32位地址,用于屏蔽IP地址的一部分以区别网络标识和主机标识,并说明该IP地址是…

可以做两个网站指向同一个域名成功案例展示网站

在.NET8 中引入了KeyedService支持,这使得可以支持一对多的依赖注入了。在官方,这个功能叫键化DI服务。 什么是键化DI服务?官方解释是这样的,键化依赖项注入(DI)服务提供了一种适用键来注册和检索DI服务的…

如何做cad的模板下载网站做漫画的网站有哪些

近来,有打算录录课、吹吹牛,于是想升级一下硬件。既然要录音,那搞个好一点儿的麦克风总是必要的。于是,上网去查。不查不知道,一查吓一跳。为啥呢?既不为产品的琳琅满目,也不为价格的云泥之别&a…

mall项目学习笔记

springdoc-openapi 替换 Swagger2 总结为什么要替换为 springdoc-openapiSpringfox/Swagger2 已停止维护 无法适配 Spring Boot 新版本,存在安全和兼容性隐患。与 Spring Boot 2.6+ 兼容性差 经常出现启动报错、NPE 等…

实用指南:通义DeepResearch论文六连发全面解读

实用指南:通义DeepResearch论文六连发全面解读pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", &…

glTF/glb:现在和未来

glTF™ 已经超越了其作为独立 3D 格式的起源。它现在被采用为 ISO 国际标准,并已成为快速扩展的软件工具、标准和扩展生态系统的核心。 鉴于 glTF 在实现跨不同平台、设备和 Web 的 3D 体验方面的核心作用,glTF 生态…

用自己网站域名这么做邮箱seo优化关键词分类

文章目录 跳动的爱心环境需求完整代码详细分析系列文章 跳动的爱心 环境需求 python3.11.4PyCharm Community Edition 2023.2.5pyinstaller6.2.0(可选,这个库用于打包,使程序没有python环境也可以运行,如果想发给好朋友的话需要这…

做网站好公司wordpress的后台链接

题目: 给你一个长度为 n 的整数数组 nums 和 一个目标值 target。请你从 nums 中选出三个整数,使它们的和与 target 最接近。 返回这三个数的和。 假定每组输入只存在恰好一个解。 示例: 示例 1: 输入:nums [-1…

如何建立一个网站的快捷方式百度商桥在网站

网络层处理发生在RS485总线上的设备之间的实际通信。由于RS485接口主要是一种电气规范,因此对话可以到此结束,但由于它支持多点,因此需要在 OSI 模型中解决它。 没有针对网络层寻址的固定规范,但RS485总线必须由主机正确管理以避…

网站架构设计师待遇怎么样设计公司装修

一、Django模板引擎 一个强大的工具,用于在HTML页面中嵌入动态内容。它使用一种被称为Django模板语言(Django Template Language)的简单而强大的语法来处理模板。该模板语言使用”{% %}”进行标记,用于执行各种操作。 二、Django…

重庆住房和城乡建设部网站的打印准考证wordpress源神

网络层功能概述 主要任务是把分组从源端传到目的端,为分组交换网上的不同主机提供通信服务。网络层传输单位是数据报。 1、路由选择与分组转发 2、异构网络互联 3、拥塞控制 数据交换方式 电路交换 在进行数据传输时,两个结点之间必须先建立一条专用…

网站建设好卖吗网站设计要注意事项

Canvas-图片旋转 众所周知canvas是位图,你可以在里面渲染你要的东西,不过你只能操作canvas的属性来进行编辑。就是说你并不能操作画进canvas的东西,例如我在canvas里添加一幅画,我现在想将那幅画移动10px,我们并不能直…

个人网站的首页网站还没有建好可以备案吗

一、项目介绍 项目总结 1.按下空格键小鸟上升,不按小鸟下落 2.搭建小鸟需要穿过的管道 3.管道自动左移和创建 4.小鸟撞到管道游戏结束 知识储备 1.C语言 2.数据结构-链表 3.Ncurses库 4.信号机制 二、Ncurses库介绍 Ncurses是最早的System V Release 4.0 (SVr4)中…

网站建设制作公司哪家网站底部版权怎么做

基本概念及统计原理 基本概念 指数平滑法的思想来源于对移动平均预测法的改进。指数平滑法的思想是以无穷大为宽度,各历史值的权重随时间的推移呈指数衰减,这样就解决了移动平均的两个难题。 统计原理 简单模型 Holt线性趋势模型 案例 为了研究上海市…

存储多边形网格的文件格式:OBJ、FBX、RenderMan、glTF、USD 等。

存储多边形网格体 在渲染方面,您始终可以直接在程序的源代码中定义网格,但这是有限的。如果每次要渲染新模型的图像时都需要重新编译程序,那将是不切实际的。为了完整起见,我们仍将在本章中研究该选项。通常,模型…

实用指南:Unity 游戏引擎中 HDRP(高清渲染管线) 的材质着色器选择列表

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

安防监控中常见的报警类型有哪些?国标GB28181平台EasyGBS的报警能力解析

安防监控中常见的报警类型有哪些?国标GB28181平台EasyGBS的报警能力解析一、安防监控中报警数据的力量 在安防监控系统中,实时报警通知让我们能够快速响应突发事件。然而,真正体现系统价值的,往往是在事后如何从海…

青岛企业网站建站模板手机下载视频网站模板下载

Guava是一个功能强大的Java开源工具库,提供了很多实用的工具类和函数,可以简化开发过程。本文将介绍Guava的一些基本用法和常用功能。 添加Guava依赖 在开始使用Guava之前,首先需要在项目中添加Guava的依赖。可以通过Maven或Gradle来管理依…

Notepad++8.6免费版下载及安装教程(附安装包)2025最新整理

一、Notepad++V8.6.4 下载链接 软件名称:Notepad++ 软件大小:4.59M 系统要求:Win7或更高。32/64位操作系统 下载链接: 夸克网盘:https://pan.quark.cn/s/6ae8353bd5a4 二、Notepad++V8.6.4 软件介绍 Notepad++是一…