别等ChatGPT开源了,升级版OPT开源模型来了!

f577fc3dbddc608577d0b745269284a0.png

源|新智元

编|Joey 昕朋

今年五月,MetaAI官宣发布了基于1750亿参数的超大模型OPT-175B,还对所有社区免费开放。

12月22日,该模型的更新版本OPT-IML(Open Pre-trained Transformer)正式上线,Meta称其「对2000个语言任务进行了微调,包含1750 亿个参数」,还将为非商业研究用途免费开放。

a21a75f4929d9497036731940537a042.png

这次更新的OPT-IML的性能表现如何,先上两张图来看看。

b914007247a77a82b1cf0cb31f08b3b4.pngb2158a1f0390552dc19c267605907ab3.png

这次的OPT-IML创建了两种模型尺寸,分别是30B和175B。

与旧版OPT模型相比,OPT-IML在14个标准NLP评估任务中的平均表现均优于OPT。

在零次学习任务上两种模型大小分别好7%~ 和32-shot 任务分别好4%~ 和 0.4%~。

在这项研究中,研究人员描述了增加模型和基准大小如何影响指令调整决策对下游任务性能的影响。

为此他们开发了 OPT-IML Bench,这是一个相当大的指令元学习 (IML) 基准,包含2000个NLP任务,这些任务根据现有的八个基准分为任务类别。

1727fc64e2cab07a1e8d2a16cdad2672.png

为训练OPT-IML 30B和175B,研究人员首先从该框架的角度对应用于 OPT-30B 的指令调优决策提出了见解。

在具有不同目标和输入格式的四个评估基准(PromptSource、FLAN、Super-NaturalInstructions 和 UnifiedSKG)上,OPT-IML 在两个尺度上展示了所有三种泛化技能。

它不仅在所有基准测试中显著优于OPT,而且以极具竞争力的方式优于针对该特定基准优化的现有模型。

此外OPT-IML已经开源,Github链接小编也放在下面啦~

81de12e6502e1bb66b04ee2394d6f300.png

Github链接:

https://github.com/facebookresearch/metaseq/tree/main/projects/OPT-IML

接下来通过论文来一起了解一下OPT-IML。

ed0624fc44cfef9c90eec134f11f48a8.png

论文链接:

https://github.com/facebookresearch/metaseq/blob/main/projects/OPT-IML/optimal_paper_v1.pdf

研究方法

大型语言模型的指令微调已成为增强其零样本和少样本泛化能力的有效方法。在这项研究中,Meta研究人员对指令微调进行了三项重要的补充。

首先,他们编译了一个大规模的指令微调基准,其中包含来自八个数据集集合的2,000个NLP任务,按任务类型分类。研究人员在此基准上有选择地构建评估拆分,以测试三种不同类型的模型泛化能力:

包括来自完全保留类别的任务(tasks from fully held-out categories)、来自已见类型的保留任务(held-out tasks from seen types)以及来自已见任务的保留实例(held-out instances from seen tasks)。

指令微调

对模型进行微调,以使它们与遵守说明保持一致,是目前机器学习的研究方向之一。
指令微调有两种方法。一种侧重于使用人工注释的指令和反馈对各种任务的模型进行微调;另一种,侧重于通过注释或自动向可公开访问的基准和数据集添加指令。
在本研究中,Meta AI成员专注于第二种技术,并编译了许多可公开访问的数据集,其中包含改进OPT的方法。
研究过程中,Meta成员使用来自四个基准的1836个任务,提出了类似的缩放方法。最后,在调整整个测试,以突破具有挑战性的外部基准(例如 MMLU 和 Big-Bench Hard (BBH))性能极限的同时,研究人员描述了可能影响下游性能的各种指令调整策略的权值。

多任务学习

多任务学习是基于指令的微调 (MTL) 的一种表述。
MTL 是一种流行的范例,当与共享可比较参数或表示的类似函数结合使用时,它可以提高任务的泛化性能。

近年来,MTL已应用于众多NLP场景,主要侧重于通过利用来自相关活动的信号来提高训练任务或新领域的性能。

相比之下,基于指令的微调有助于我们提高对前所未见问题的泛化性能。它是通过指令将所有任务组合成一个概念并通过在所有任务上分配模型的权重来一起训练它们来实现的。

什么是OPT?

大型语言模型,即具有超过 1000 亿个参数的自然语言处理系统,在过去几年中改变了NLP和AI研究。

这些模型接受了大量不同文本的训练,展现出令人惊讶的新能力,可以生成创意文本、解决基本数学问题、回答阅读理解问题等等。

虽然在某些情况下,公众可以通过付费 API 与这些模型进行交互,但完整的研究访问权限仍然仅限于少数资源丰富的实验室。

这种受限访问限制了研究人员理解这些大型语言模型如何工作以及为何工作的能力,阻碍了提高其鲁棒性和减轻偏见等已知问题的进展。

出于对开放科学的承诺,Meta AI于今年5月发布了Open Pretrained Transformer (OPT-175B),这是一个具有 1750 亿参数的模型,在公共数据集上训练而成,之所以共享这个模型,Meta AI 希望更多的社区参与理解关于大模型的基本技术。

简单来说,Meta将用于人工智能研究的大型语言模型访问权限开放给大众,从而实现大模型研究的人工智能民主化。

与老版对比

根据Meta现在发布的IML版本经过微调,在自然语言任务上的表现比旧版OPT更好。

典型的语言任务包括回答问题、总结文本和翻译。

为了进行微调,研究人员使用了大约2000个自然语言任务。这些任务分为八个NLP基准(OPT-IML Bench),研究人员也提供了这些基准。

平均而言,以30B和175B模型为例,OPT-IML比OPT的零次学习准确度提高了约 6-7%。在32次学习中,300亿参数的模型准确度有显著改进,1750亿参数的模型有轻微改进。

22ec6157a3c9208ac69f60760aabee3a.png

经过对比,Meta团队发现OPT-IML的性能在所有基准测试上都优于OPT,并且在零样本和少样本学习准确度方面,比其他基于指令微调的模型更具有竞争力。

d06d7aee5928fdb6e2284bbeae5a737d.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

00eaf7a58430ad04cf16a1c8b8c7a3cc.png

[1]https://the-decoder.com/opt-iml-meta-releases-open-source-language-model-optimized-for-tasks/

[2]https://wandb.ai/telidavies/ml-news/reports/OPT-IML-Meta-Releases-New-Instruction-Tuned-OPT-Models-NLP-Task-Benchmark--VmlldzozMjAzMzc1

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/476472.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

浅谈“三层结构”原理与用意(转帖)

浅谈“三层结构”原理与用意 序 在刚刚步入“多层结构”Web应用程序开发的时候,我阅读过几篇关于“asp.net三层结构开发”的文章。但其多半都是对PetShop3.0和Duwamish7的局部剖析或者是学习笔记。对“三层结构”通体分析的学术文章几乎没有。 2005年2月11日&#…

python bottle支持https_python bottle 简介

bottle是一个轻量级的pythonweb框架, 可以适配各种web服务器,包括python自带的wsgiref(默认),gevent, cherrypy,gunicorn等等。bottle是单文件形式发布,源码在这里可以下载,代码量不多&#xff…

NVIDIA重磅发布NVAIE 3.0,AI时代的操作系统来了

文|卖萌酱近年来,AI技术发展迅速,随着以Pytorch、TensorFlow为代表的深度学习框架的成熟,AI模型的训练流程已经变得相对清晰、成熟。然而,预训练模型和后续一系列超大模型的出现,使得对于大部分AI开发者和企…

python序列符号_Python中的文本和字节序列

导语:本文章记录了本人在学习Python基础之数据结构篇的重点知识及个人心得,打算入门Python的朋友们可以来一起学习并交流。本章重点:1、了解字符字节等概念,编解码问题;2、熟悉字符的规范化处理和双模式API。一、基本概…

LeetCode 258. 各位相加

1. 题目 给定一个非负整数 num,反复将各个位上的数字相加,直到结果为一位数。 示例: 输入: 38 输出: 2 解释: 各位相加的过程为:3 8 11, 1 1 2。 由于 2 是一位数,所以返回 2。 进阶: 你可以不使用循环或者递归&#xff0…

读取 Radio 的值

读取 Radio 的值 2 <form id"form1"action""method"">3 <div><input type"radio"name"r"id"r1"value"一"><label for"r1">选项一</label></div>4 <d…

够快,首个“开源ChatGPT项目“来了!网友吐槽:这谁能跑

文&#xff5c;明敏 源&#xff5c;量子位就说程序员的手速有多快吧&#xff0c;首个开源ChatGPT项目已经出现了&#xff01;基于谷歌语言大模型PaLM架构&#xff0c;以及使用从人类反馈中强化学习的方法&#xff08;RLHF&#xff09;&#xff0c;华人小哥Phillip Wang复刻了一…

linux 串口工具_会C++就能开发Linux/Android应用!这款Yoxios X3串口屏火了...

大家好&#xff0c;我是小月月。今天给大家介绍一款搭载YOXIOS操作系统的YOXIOS X3串口屏&#xff0c;只要你会C/C就能开发Linux/Android应用&#xff01;而且小月月带来了福利——“免费试用名额”&#xff01;&#xff01;YOXIOS X3介绍YOXIOS X3串口屏比传统串口屏要强大得多…

LeetCode 278. 第一个错误的版本(二分查找)

1. 题目 你是产品经理&#xff0c;目前正在带领一个团队开发新的产品。 不幸的是&#xff0c;你的产品的最新版本没有通过质量检测。 由于每个版本都是基于之前的版本开发的&#xff0c;所以错误的版本之后的所有版本都是错的。 假设你有 n 个版本 [1, 2, …, n]&#xff0c;…

LeetCode 284. 顶端迭代器

1. 题目 给定一个迭代器类的接口&#xff0c;接口包含两个方法&#xff1a; next() 和 hasNext()。 设计并实现一个支持 peek() 操作的顶端迭代器 – 其本质就是把原本应由 next() 方法返回的元素 peek() 出来。 示例: 假设迭代器被初始化为列表 [1,2,3]。调用 next() 返回 1…

ChatGPT国内镜像站

ChatGPT介绍 ChatGPT是OpenAI开发的一个大型预训练语言模型。它是GPT-3模型的变体&#xff0c;GPT-3经过训练&#xff0c;可以在对话中生成类似人类的文本响应。ChatGPT 旨在用作聊天机器人&#xff0c;我们可以对其进行微调&#xff0c;以完成各种任务&#xff0c;如回答问题…

【转】DATAGRIDVIEW控制

目录&#xff1a; 取得或者修改当前单元格的内容 设定单元格只读 不显示最下面的新行 判断新增行 行的用户删除操作的自定义 行、列的隐藏和删除 禁止列或者行的Resize ★ DataGridView 取得或者修改当前单元格的内容&#xff1a; GO TO TOP 当前单元格指的是 DataGridView…

matlab 动画_MATLAB绘图动画(1)

今天写一个案列&#xff0c;绘图动画画出以下曲面函数随着theta角的变化的动图程序代码&#xff1a;clc,clear,close allx-8:0.5:8;[X,Y]meshgrid(x);rsqrt(X.^2Y.^2);Zsin(r)./r;figure(color,w);surf(Z); %画出帧theAxes axis; %保存…

LeetCode 2020 力扣杯全国春季编程大赛(1644/4093,前40.2%)

文章目录1. 比赛结果2. 题目解析2.1 拿硬币 Easy2.2 传递信息 Esay2.3 剧情触发时间 Medium2.4 最小跳跃次数 Hard2.5 二叉树任务调度 Hard1. 比赛结果 前两题比较顺利&#xff0c;24分钟做出来了&#xff0c;第3&#xff0c;4两题试了好久&#xff0c;都显示超时&#xff0c;…

silverlight2.0 demo实例,源码下载

这是最近发现的微软官方网站上提供的学习例子&#xff0c;并有源码下载&#xff0c;与大家分享。 http://silverlight.net/Community/gallerydetail.aspx?catsl2 下面这个链接是银光开源中心提供的&#xff0c;也不错哦。。 http://www.slcenter.cn/ YoLing音频播放器v1.0 for…

网页设计框架布局代码_网页设计中的分屏切割布局法

今天和大家聊的是一种关于网页设计中的视觉呈现方法&#xff0c;一般我们称之为“分屏布局”&#xff0c;是一种常见的网页设计排版方式&#xff0c;将页面分割为均等或者不均等的两部分&#xff0c;这种方式的好处就是可以将文字信息和图像元素进行更有效的布局区分&#xff0…

LeetCode 第 24 场双周赛(326/1898,前17.2%)

文章目录1. 比赛结果2. 题目1. LeetCode 5372. 逐步求和得到正数的最小值 easy2. LeetCode 5373. 和为 K 的最少斐波那契数字数目 medium3. LeetCode 5374. 长度为 n 的开心字符串中字典序第 k 小的字符串 medium4. LeetCode 5375. 恢复数组 hard1. 比赛结果 做出来了 1、2、3…

货物与产品的区别_超市货架和仓储式货架有什么区别?

在生活中&#xff0c;超市货架和仓储货架咱们都叫货架&#xff0c;这样导致了很多客户都认为货架不就是超市里面摆货的那个货架吗&#xff1f;其实&#xff0c;虽然两种都叫货架&#xff0c;两者之间都有存储功能&#xff0c;但还有其它的区别。仓库货架注重的是存储量和承重量…

详细解析Java中抽象类和接口的区别

详细解析Java中抽象类和接口的区别 在Java语言中&#xff0c; abstract class 和interface 是支持抽象类定 义的两种机制。正是由于这两种机制的存在&#xff0c;才赋予了Java强大的 面向对象能力。abstract class和interface之间在对于抽象类定义的支持方面具有很大的相似性&a…

LeetCode 1417. 重新格式化字符串

1. 题目 给你一个混合了数字和字母的字符串 s&#xff0c;其中的字母均为小写英文字母。 请你将该字符串重新格式化&#xff0c;使得任意两个相邻字符的类型都不同。 也就是说&#xff0c;字母后面应该跟着数字&#xff0c;而数字后面应该跟着字母。 请你返回 重新格式化后 …