别等ChatGPT开源了，升级版OPT开源模型来了！

源｜新智元
编｜Joey 昕朋

今年五月，MetaAI官宣发布了基于1750亿参数的超大模型OPT-175B，还对所有社区免费开放。

12月22日，该模型的更新版本OPT-IML（Open Pre-trained Transformer）正式上线，Meta称其「对2000个语言任务进行了微调，包含1750 亿个参数」，还将为非商业研究用途免费开放。

这次更新的OPT-IML的性能表现如何，先上两张图来看看。

这次的OPT-IML创建了两种模型尺寸，分别是30B和175B。

与旧版OPT模型相比，OPT-IML在14个标准NLP评估任务中的平均表现均优于OPT。

在零次学习任务上两种模型大小分别好7%~ 和32-shot 任务分别好4%~ 和 0.4%~。

在这项研究中，研究人员描述了增加模型和基准大小如何影响指令调整决策对下游任务性能的影响。

为此他们开发了 OPT-IML Bench，这是一个相当大的指令元学习 (IML) 基准，包含2000个NLP任务，这些任务根据现有的八个基准分为任务类别。

为训练OPT-IML 30B和175B，研究人员首先从该框架的角度对应用于 OPT-30B 的指令调优决策提出了见解。

在具有不同目标和输入格式的四个评估基准（PromptSource、FLAN、Super-NaturalInstructions 和 UnifiedSKG）上，OPT-IML 在两个尺度上展示了所有三种泛化技能。

它不仅在所有基准测试中显著优于OPT，而且以极具竞争力的方式优于针对该特定基准优化的现有模型。

此外OPT-IML已经开源，Github链接小编也放在下面啦~

Github链接:
https://github.com/facebookresearch/metaseq/tree/main/projects/OPT-IML

接下来通过论文来一起了解一下OPT-IML。

论文链接：
https://github.com/facebookresearch/metaseq/blob/main/projects/OPT-IML/optimal_paper_v1.pdf

研究方法

大型语言模型的指令微调已成为增强其零样本和少样本泛化能力的有效方法。在这项研究中，Meta研究人员对指令微调进行了三项重要的补充。

首先，他们编译了一个大规模的指令微调基准，其中包含来自八个数据集集合的2,000个NLP任务，按任务类型分类。研究人员在此基准上有选择地构建评估拆分，以测试三种不同类型的模型泛化能力：

包括来自完全保留类别的任务（tasks from fully held-out categories）、来自已见类型的保留任务（held-out tasks from seen types）以及来自已见任务的保留实例（held-out instances from seen tasks）。

指令微调

对模型进行微调，以使它们与遵守说明保持一致，是目前机器学习的研究方向之一。
指令微调有两种方法。一种侧重于使用人工注释的指令和反馈对各种任务的模型进行微调；另一种，侧重于通过注释或自动向可公开访问的基准和数据集添加指令。
在本研究中，Meta AI成员专注于第二种技术，并编译了许多可公开访问的数据集，其中包含改进OPT的方法。
研究过程中，Meta成员使用来自四个基准的1836个任务，提出了类似的缩放方法。最后，在调整整个测试，以突破具有挑战性的外部基准（例如 MMLU 和 Big-Bench Hard (BBH)）性能极限的同时，研究人员描述了可能影响下游性能的各种指令调整策略的权值。