2022的结尾,对话系统起飞了

8e11f67c2c90de1289f283c152e37a46.png

文 | 郑楚杰@知乎

编者记:近日来,ChatGPT的连续刷屏让人们重新看到了AI的希望,编者通过对ChatGPT的试用,发现其对话能力早已不同于两年前的对话系统了,可以说,有了质的飞跃,向着用户体验奇点迈进了一大步。本文就来跟随一位对话领域的大佬,一起了解下对话领域这两年是如何演变至今日的起飞的!

我是从 19 年开始做对话研究的。

根据我的感受,在 21 年之前,对话这块的风向一直是 Meta AI / FAIR 引领的,例如:人格化 (18)、知识性 (19)、共情性 (19)、一致性 (19)、安全性 (19)、反馈/终身学习 (19)、跨模态 (20)、长时记忆 (21)。

值得一提的是,他们一直在开源所收集的数据、所训练的模型。

从上面罗列的也可以看出,过去做对话的思路是从局部到整体,各个击破再加以整合。从今年 Meta AI 发布的 BlenderBot 3 和 CICERO 也能看出这一思路的影子

dd10986b0b4cf79dfd1ff9e88709bc1d.jpeg

BlenderBot 3 流程图,模块化搞起来

从今年(22年)开始,Google 的 LaMDA、DeepMind 的 Sparrow、OpenAI 的 InstructGPT 和 ChatGPT,其实换了不一样的思路:局部过于琐碎,直接一把梭。

与其由开发者为各个模块/技能点制定规范,不如由用户方给出指导和信号,这样训出来的模型更与用户需求 aligned。

甚至开发者都无需再了解「对话」这一场景的本质内涵(如前述的对话一致性),大力出奇迹但需要承认的是,这种粗粒度搞对话系统的方式需要基础模型足够强大,就像 ChatGPT 的基础模型 InstructGPT 在此前已经是地表最强了一方面,基础模型的能力是 ChatGPT 整套流程得以 work 的前提。

以 Meta AI 的 OPT 模型为例,虽然达到了与 GPT-3 同等的 175B 参数量,但生成能力仍然差很多,即使它用了 ChatGPT 的 demonstration data 训练,训出来的 policy 也不具备足够的泛化能力另一方面,很多文本生成的长尾/基础问题,如对话一致性、文本生成的连贯性和重复性等,会在高质量的预训练数据和 scaling 的作用下神奇地得到极大缓解。

这使得开发者无需再关注以往研究中的这些颇为头疼但又难以解决的问题,而只需要关注任务本身即可换句话说,其他的开发者即使有了 ChatGPT 的训练数据,也很难训出 ChatGPT 这样的效果,因为它们所立足的巨人的肩膀已经有着难以弥补的鸿沟了。

1e14c6ee15dddd53653322053f5d3277.jpeg

直接让用户示范「应该怎么做」、指导「怎么做更好」

另外,与 Meta AI(以及我组)不同的是,这些项目对对话系统的定位是功能性的 AI assistant,这抛弃了过去所突出的 human-like 或 personality,因此显然带有更原始的任务型对话系统的特征。

确切地说,它们是开放领域的任务型对话系统(不限任务范畴、任意输入形式),而非拟人化的闲聊机器人。

事实上,过于强调人格化也带来了许多安全隐患和伦理风险,侧重于功能性则带来更高的实用性。至于哪条道路才是未来,可能就见仁见智了。

f09e9fb53f8ee951797315ccff18ea7b.jpeg

DeepMind Sparrow 拒绝回答与人格相关的问题

当然,标数据必然花费了相当多的人力和财力(估计他们的标注质量比 Meta AI 一直采用的 AMT 标注要高得多),训大模型也需要庞大的算力。

这些项目的成功充分证明了钞能力的力量,作为护城河的数据更是不会开源了今年最大的感受是,通用领域的玩家下场搞垂直赛道真的是降维打击。

这也反映了以往对话领域的困境:令对话系统取得飞跃式进展的技术几乎都来自通用领域(大规模预训练、检索增强等),想搞真正有用的创新只能从数据层面入手。

当数据的优势也失去后,便难有招架之力了想到了 Jason Wei 大佬前阵子说的这段话(原 tweet 似乎被删了,可以辩证地看他的观点),做大模型能够带来很多全新的视角,就像 GPT-3、PaLM 已经是与 BERT、GPT-2 迥然不同的物种,就像 OpenAI 采用与过去不同的角度做了 ChatGPT。反倒是入场早的老玩家容易思路闭塞和脱节(敲响警钟)。

23706f45423c097ee68a27499094ad2c.jpege88a36f65de7d44b9083b9c4d6fe0085.jpeg

最后感慨一下,作为和 n+e 大哥同届本科的菜鸡,n 大哥已经开始改变世界了,而我还在挣扎于发论文毕业 :)

11d57f4e175fc01a7e4c0976b817e31c.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜广推与求职讨论群

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/476589.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python清除列表内容_Python 列表的清空方式

情况列表的操作: del list[:] list[] list[:][] def func(L): L.append(1) print L #L[:][] #del L[:] L [] print L L[] func(L) print L 输出结果: [1] [] [1] 分析:L是可变数据类型,L作为参数,函数内对L的改变&…

ASP.NET小收集:Word的编码是Unicode

Word的编码是Unicode&#xff0c;从Word连接的超链接会附带Unicode编码进行打开&#xff0c;所以&#xff0c;如果没有对链接页面设定编码&#xff0c;将出现乱码&#xff0c;解决方法之一&#xff1a;设置编码为UTF-8<meta http-equiv"Content-Type" content&quo…

程序员面试金典 - 面试题 05.08. 绘制直线(位运算)

1. 题目 绘制直线。有个单色屏幕存储在一个一维数组中&#xff0c;使得32个连续像素可以存放在一个 int 里。 屏幕宽度为w&#xff0c;且w可被32整除&#xff08;即一个 int 不会分布在两行上&#xff09;&#xff0c;屏幕高度可由数组长度及屏幕宽度推算得出。 请实现一个函数…

FarPoint Spread For .Net 4.0

FarPoint Spread For .Net 4.0 ftp://ftp.fpoint.com/Trials/SpreadWinForm/spwin.zip http://www.fpoint.com:8080/files/Trials/SpreadWinForm/spwinframework35.zip 转载于:https://www.cnblogs.com/Tonyyang/archive/2008/06/23/1228133.html

入职比你晚,薪资比你高,礼貌吗

文&#xff5c; 穆胜咨询研究院源&#xff5c; 穆胜咨询秋招已过&#xff0c;企业迎来了许多新的面孔&#xff0c;对于很多老员工来说却是五味杂陈。新人空降拿到高工资&#xff0c;而自己的资历却换不来期待幅度的涨薪。“新老员工薪资倒挂”的问题&#xff0c;本就是HR的一道…

乐学python_【IT专家】铁乐学python

铁乐学 python 2018/04/18 13 铁乐学 python_day23_ 面向对象进阶 1_ 反射 以下内容大部分摘自博客 cnblogs/Eva-J/ isinstance() 和 issubclass() 两者的返回值都是布尔值 isinstance() 能够检测到继承关系 type() 只能单纯的判 断类 isinstance() 判断一个对象和一个类有没有…

程序员面试金典 - 面试题 16.14. 最佳直线(哈希map+set)

1. 题目 给定一个二维平面及平面上的 N 个点列表Points&#xff0c;其中第i个点的坐标为Points[i][Xi,Yi]。 请找出一条直线&#xff0c;其通过的点的数目最多。 设穿过最多点的直线所穿过的全部点编号从小到大排序的列表为S&#xff0c;你仅需返回[S[0],S[1]]作为答案 若有多…

Visual C# 2008+SQL Server 2005 数据库与网络开发--13.1.1 菜单创建

创建菜单的方法大体可以包括两种&#xff0c;比较简单的方法是通过Visual Studio 2008提供的菜单设计工具来创建&#xff0c;这种方式创建的菜单比较固定。另外一种方式是通过后台程序创建&#xff0c;这种方式由于通过代码在窗体菜单加载的时候完成&#xff0c;所以编写过程相…

c语言数据类型_C语言基础数据类型

点击上方“C语言中文社区”&#xff0c;选择“设为星标★”技术干货第一时间送达&#xff01;基本类型基本类型就是我们在使用C语言时最基础的数据类型&#xff0c;包括整形(短整型&#xff0c;基本整型&#xff0c;长整型)、字符型、浮点型(单、双精度)以及枚举类型。构造类型…

为辨别offer含金量,我做了个时薪计算器

文 | 曹宾玲源 | 表外表里提到计算机专业&#xff0c;大部分人第一时间会联想到“万金油专业”“大厂”和“高薪”。但在2023届计算机毕业生眼里&#xff0c;这已经是过去式了。以前被嫌弃的华子&#xff0c;今年校招群里挤满了人&#xff0c;即使一直泡在“人才池”里&#xf…

程序员面试金典 - 面试题 16.22. 兰顿蚂蚁(deque模拟)

1. 题目 一只蚂蚁坐在由白色和黑色方格构成的无限网格上。 开始时&#xff0c;网格全白&#xff0c;蚂蚁面向右侧。 每行走一步&#xff0c;蚂蚁执行以下操作。 (1) 如果在白色方格上&#xff0c;则翻转方格的颜色&#xff0c;向右(顺时针)转 90 度&#xff0c;并向前移动一个…

在程序中设置infopath中的整型等域值时出错解决方法

最近一直和infopath表单打交道&#xff0c;碰到的问题也比较多&#xff0c;刚刚就碰到一个在程序中修改infopath表单中域的内容时出错的问题&#xff0c;写出来与大家共享一下&#xff0c;我想这个问题&#xff0c;可能玩infopath的话&#xff0c;迟早会碰上的吧。具体表现就是…

python中如何输入矩阵_python - 如何向矩阵中添加向量_numpy_酷徒编程知识库

首先&#xff0c;我们可以初始化一个用零填充所需形状的矩阵&#xff0c;然后将a复制到前13行。在任何情况下&#xff0c;我们都必须形成一个新的矩阵&#xff0c;因为我们无法摆弄现有的矩阵/向量&#xff0c;因为我们需要为额外的空行分配更多的内存。 你可以在下面找到例子演…

聚类方法(Clustering)

文章目录1. 聚类基本概念1.1 相似度、距离1.2 类、簇1.3 类之间的距离2. 层次聚类3. K均值聚类3.1 模型3.2 策略3.3 算法3.4 算法特性4. sklearn.cluster4.1 sklearn.cluster.KMeans k均值聚类4.2 Hierarchical clustering 层次聚类聚类&#xff1a;依据样本特征的相似度或距离…

三十岁以前不必在乎的29件事

【放弃】把握的反面就是放弃&#xff0c;选择了一个机会&#xff0c;就等于放弃了其他所有的可能。当新的机会摆在面前的时候&#xff0c;敢于放弃已经获得的一切&#xff0c;这不是功亏一篑&#xff0c;这不是半途而废&#xff0c;这是为了谋求更大的发展空间&#xff1b;或者…

python写名片管理系统_Python实现名片管理系统

本文实例为大家分享了Python实现名片管理系统的具体代码&#xff0c;供大家参考&#xff0c;具体内容如下 目标 综合应用已经学习过的知识点&#xff1a; 变量 流程控制 函数 模块 系统需求 1. 程序启动&#xff0c;显示名片管理系统欢迎界面&#xff0c;并显示功能菜单2 用户用…

程序员面试金典 - 面试题 17.24. 最大子矩阵(转成一维最大子序和 DP)

文章目录1. 题目2. 解题2.1 前缀和&#xff08;超时&#xff09;2.2 动态规划1. 题目 给定一个正整数和负整数组成的 N M 矩阵&#xff0c;编写代码找出元素总和最大的子矩阵。 返回一个数组 [r1, c1, r2, c2]&#xff0c;其中 r1, c1 分别代表子矩阵左上角的行号和列号&…

解决mysql表被crash的一次维护始末

有客户反馈&#xff22;&#xff2f;&#xff33;&#xff33;系统无法查询到6月28日以后的话单纪录&#xff0c;查询数据库后发现在执行对原始话单表执行查询时候偶尔出现 Table ***** is marked as crashed and should be repaired. 确定计费无误后决定在下班后执行对表的修复…

ICLR盲审阶段就被评审赞不绝口的论文:会是Transformer架构的一大创新吗?

编&#xff5c;杜伟、陈萍源&#xff5c;机器之心首次&#xff01;无残差连接或归一化层&#xff0c;也能成功训练深度transformer。尽管取得了很多显著的成就&#xff0c;但训练深度神经网络&#xff08;DNN&#xff09;的实践进展在很大程度上独立于理论依据。大多数成功的现…

python自带的shell、其性能优于ipython_python3.4 shell

实验1 目的和要求(1) (2) (3) (4) (5) (6) (7) 开始 python 编程 了解什么是 python? 了解 python 的特性 学习下载和安装 python 学习执行 python ...... (2) 了解 python 的特性 (3) 学习下载和安装 python (4) 学习执行 python 命令和脚本文件的方法 (5) 学习 python 语音的…