NAACL最佳方法论文:课本上的A*搜索算法可以提升文本生成效果!

26c381a8f083c6f0b1e69eceb1904f53.png

文 | Yimin_饭煲

相信大多数学习过人工智能课程的读者,当听到算法的时候,都会有一种既熟悉又陌生的感觉。说算法熟悉,是因为一听到这个算法,就想起那本厚厚的《人工智能——一种现代的方法》,想起这个算法似乎是人工智能课程考试的重点;说算法陌生,是因为大家现在在从事人工智能相关的研究和开发工作时,似乎又很少用到这个算法,大部分时间都花在了研究数据处理和处理实验设置上面。而在NAACL2022上,一群来自AI2的自然语言处理研究者们 利用算法开发了一种新的自然语言生成解码方式,还被授予了NAACL2022 Best New Method paper。看起来已经过时的A*算法,居然能在深度学习时代有如此的妙用,看完这篇论文,笔者情不自禁地打开了《人工智能——一种现代的方法》,想看看还有什么经典算法可以深挖一下!

论文标题:
NEUROLOGIC A*esque Decoding: Constrained Text Generation with Lookahead Heuristics

论文链接:
https://arxiv.org/pdf/2112.08726.pdf

问题背景

自然语言生成任务一般指给定一个输入序列,生成一个输出序列。目的是解出使得目标函数最大化的序列,其中, , 而衡量对约束条件的满足。传统的Beam Search不考虑全局的最优,而是最优化当前步骤添加的Token.

402 Payment Required

为了达到全局最优的效果,需要满足如下的优化目标

主要方法

前向启发算法

直接优化全局最优目标面临着搜索空间过大的问题。而A算法可以被用来解决这个搜索问题。A算法是一个最优优先的搜索算法,可以解决这样形式的搜索问题:

其中是迄今为止的分数,是对于未来分数的启发式估计。因此我们将优化目标修改为如下形式

同时,需要限制前向搜索的长度为,避免模型无限制地向前搜索

402 Payment Required

在前向生成的过程中有几种不同的方法。方法只生成一个序列,从开始,每次选择概率最大的Token 。方法采用插值的思想,混合方法和随机选择一个Token的概率分布。方法从开始进行步的Beam Search,选择前个概率最大的序列, 而方法则是直接从按照概率进行采样。

无限制生成

在无限制生成的场景下,使用的优化函数为

其中控制的是对未来估计的重视程度,类似于加权算法

受限制生成

在受限制生成任务上,作者们基于之前的工作NeuroLogic进行改进。首先我们简要介绍一下NeuroLogic方法。首先,将对生成文本的限制表示为合取范式。其中每一个表示一个限制条件,。NeuroLogic的优化目标可以写为

其中远大于0,用来惩罚不满足的约束。在每一步搜索时,NeuroLogic利用如下的打分函数进行计算

其中是约束条件的前缀,这个优化函数的目标是奖励那些满足约束条件的样本。接下来,作者们加入了前向启发函数

402 Payment Required

这样的前向启发函数有两个好处,如果是满足多Token约束的一个Token,前向启发函数包含了全部约束的分数,如果不是约束的一部分,如果被选中,这一前向策略能考虑到未来约束的分数。

实验结果

无限制生成

556fe19f087468c336fdc5394df345f6.png作者们在故事生成任务上开展了实验,可以发现提出的方法不论是在流畅性,丰富性还是人工评估上都有着很好的表现。

受限制生成

在受限制生成方面,作者们在常识生成,机器翻译,表格到文本生成,问题生成等任务上开展了实验。在这里展示常识生成方面的结果。这一任务的主要内容是给定一系列概念,利用全部概念生成一个合理的句子.f91e0fd33ca390040dc1af250e5d2818.png可以发现,作者们提出的方法在多个指标上都明显超越了基线模型,取得了很好的效果。7e969a2222477340d4a167b7a6ad307c.png从文章中给出的例子来看,作者们提出的方法确实有着更好的生成效果。

结语

本文的方法实现并不复杂,所用到的原理和思想也是非常经典的人工智能算法,但却取得了非常不错的性能,一举摘得了NAACL2022的最佳方法论文。看来,好的研究并不是追逐热点,调参魔改结构的增量式创新,而是打好数学基础,深入地思考研究问题,广泛接触各个领域的算法,才能在发现领域的关键待解决问题时取得成果~

0c800d025012aba3ddd0326bfda7d1ee.jpeg萌屋作者:Yimin_饭煲

在微软NLC组搬砖的联培博士生,爱好摄影和运动,希望卖萌屋早日开通视频业务,我来当摄影师!

作品推荐

  1. 学完文本知识,我就直接看懂图片了!

  2. 别再Prompt了!谷歌提出tuning新方法,强力释放GPT-3潜力

  3. 大模型炼丹无从下手?谷歌、OpenAI烧了几百万刀,总结出这些方法论…

4fb9ea9e37a52ad8075ed1f4eb7945c6.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477104.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 6. Z 字形变换(找规律)

1. 题目 将一个给定字符串根据给定的行数,以从上往下、从左到右进行 Z 字形排列。 比如输入字符串为 “LEETCODEISHIRING” 行数为 3 时,排列如下: L C I R E T O E S I I G E D H N之后,你的输出需要从左往右逐行…

美团点评移动网络优化实践

本文根据第16期美团点评技术沙龙“移动开发实践(上海站)”演讲内容整理而成。 第18期沙龙:高可用系统背后的基础架构(3月25日)火热来袭!快快点击报名吧。 网络优化对于App产品的用户体验至关重要&#xff0…

我终于逃离了互联网,却陷入了迷茫

大家好,我是卖萌酱。昨天跟一位成功逃离互联网的好姐妹小A约了个饭,这位姐妹的早期经历可以说是略带传奇色彩了,过程却比较崎岖,结局心情复杂,但却对普通人来说却很有启发意义。经过小A允许,卖萌酱将小A的故…

LintCode 633. 寻找重复的数(这个题要复习)

1. 题目 给出一个数组 nums 包含 n 1 个整数,每个整数是从 1 到 n (包括边界),保证至少存在一个重复的整数。假设只有一个重复的整数,找出这个重复的数。 样例 1: 输入: [5,5,4,3,2,1] 输出: 5样例 2: 输入: [5,4,4,3,2,1] 输出: 4注意事项…

业务赋能利器之外卖特征档案

应用背景及现状 美团外卖业务自2013年9月启动至今已运营三年时间。截至2016年12月,美团点评整个外卖平台的日订单超过900万。从发展速度和体量上看,外卖业务仍处在迅猛发展的上升期。与早期飞速增长的状态相比,随着规模的不断扩大&#xff0c…

训练双塔检索模型,可以不用query-doc样本了?明星机构联合发文

文 | QvQ对于开放域检索式QA系统而言,其本质是计算question和doc的本文相似度,而作为老生常谈的文本相似度问题,有监督方法的性能历来是要好于无监督算法的。今天要介绍的文章,反其道而行之,不仅采用了无监督算法&…

MGW——美团点评高性能四层负载均衡

本文整理自美团点评技术沙龙第14期:美团背后的故事-你不知道的美团云。 美团点评技术沙龙由美团点评技术团队主办,每月一期。每期沙龙邀请美团点评及其他互联网公司的技术专家分享来自一线的实践经验,覆盖各主要技术领域。 目前沙…

剑指Offer - 面试题36. 二叉搜索树与双向链表(中序循环/递归)

1. 题目 输入一棵二叉搜索树,将该二叉搜索树转换成一个排序的循环双向链表。要求不能创建任何新的节点,只能调整树中节点指针的指向。 特别地,我们希望可以就地完成转换操作。当转化完成以后,树中节点的左指针需要指向前驱&#…

知乎高赞:拼多多和国家电网,选哪个?

源 | 知乎、AINLP最近在知乎上看到一个关于职业选择的问题,虽然都是老生常谈的话题了,但是几个知友的回答获得非常多的赞同,拿来和大家分享一下。知乎上有人问本人是某top3本硕,EE专业,秋招拿到了老家不差的地级市国网…

大众点评订单系统分库分表实践

原大众点评的订单单表早就已经突破两百G,由于查询维度较多,即使加了两个从库,优化索引,仍然存在很多查询不理想的情况。去年大量抢购活动的开展,使数据库达到瓶颈,应用只能通过限速、异步队列等对其进行保护…

NLP未来,路在何方?从学术前沿和业界热点谈起

近两年,人工智能的应用越来越“卷”了,每隔一段时间就会出现一个让人大呼“respect”的技术。AI好像也更加懂人类,越来越接近“人的智能”。就好比今年高考期间被各大科技媒体反复拿来讲的AI高考的案例。如今的“AI做题家”不光能参加高考&am…

剑指Offer - 面试题46. 把数字翻译成字符串(DP)

1. 题目 给定一个数字,我们按照如下规则把它翻译为字符串: 0 翻译成 “a” , 1 翻译成 “b”,……, 11 翻译成 “l”,……, 25 翻译成 “z”。 一个数字可能有多个翻译。请编程实现一个函数&a…

美团数据库运维自动化系统构建之路

本文整理自美团点评技术沙龙第10期:数据库技术架构与实践。 美团点评技术沙龙由美团点评技术团队主办,每月一期。每期沙龙邀请美团点评及其它互联网公司的技术专家分享来自一线的实践经验,覆盖各主要技术领域。 目前沙龙会分别在北京、上海和…

推荐一个开源的炼丹神器MegPeak!算法工程师的仪表盘

在算力需求爆炸的大背景下,如何发挥出已有硬件的最大算力变得非常重要,直观一点是:我们需要对现有算法针对特定的处理器进行极致的性能优化,尽量满足目前AI算法对算力的高要求。为了能够做到极致的性能优化,我们可能的…

LintCode 390. 找峰值 II

1. 题目 给定一个整数矩阵 A, 它有如下特性: 相邻的整数不同矩阵有 n 行 m 列。对于所有的 i < n, 都有 A[i][0] < A[i][1] && A[i][m - 2] > A[i][m - 1]对于所有的 j < m, 都有 A[0][j] < A[1][j] && A[n - 2][j] > A[n - 1][j] 我们定…

Node.js Stream - 实战篇

前面两篇&#xff08;基础篇和进阶篇&#xff09;主要介绍流的基本用法和原理&#xff0c;本篇从应用的角度&#xff0c;介绍如何使用管道进行程序设计&#xff0c;主要内容包括&#xff1a; 管道的概念Browserify的管道设计Gulp的管道设计两种管道设计模式比较实例所谓“管道”…

我们的Web3创业项目,黄了

文 | 邬宇琛源 | 投资界PEdaily这是今年VC圈最具争议的赛道&#xff0c;如今也可能是熄灭最快的赛道。三个月&#xff0c;换了三个方向。今年春天&#xff0c;北京某出海互联网公司在内部筹划起一个新的项目&#xff0c;项目直指风口——Web3。毫无Web3经验的互联网运营经理吴欣…

决策树(Decision Tree,DT)

文章目录1. 决策树模型与学习2. 特征选择2.1 特征选择Python代码3. 决策树的生成3.1 Python代码4. 决策树的剪枝5. CART 算法6. sklearn 例子6.1 书上贷款例子6.2 鸢尾花 及 决策树可视化附. 本文完整代码决策树&#xff08;decision tree&#xff09;是一种基本的分类与回归方…

使用模板快速编写测试用例

在高速发展的互联网公司&#xff0c;由于产品的开发迭代太快&#xff0c;产品测试经常遇到以下几个问题&#xff1a; 1. 如何在快速的产品开发迭代中迅速地完成对产品功能的测试&#xff1f; 2. 面对用户众多、环境多样&#xff0c;如何尽可能地测试全面&#xff1f; 3. 公司扩…

最新!Kaggle所有竞赛开源方案和Top思路汇总,共477场竞赛!

数据竞赛能帮助我们快速提升数据分析和建模能力&#xff0c;非常多的朋友也非常希望学习Top比赛的方案。之前也有非常多的朋友问我某某竞赛的方案有没有&#xff0c;有时我不是很忙的时候就会把对应的竞赛中把Top的链接找出来一起整理发过去&#xff0c;但也有的时候可能会比较…