论文浅尝 - AAAI2020 | 通过知识库问答改善知识感知对话生成

论文笔记整理:胡楠,东南大学博士。


来源:AAAI 2020

动机

现在的将外部知识整合到对话系统中的研究仍然存在一定缺陷。首先,先前的方法难以处理某些语句的主语和关系,比如当语句中的相关实体彼此相距较远时。其次,先前的基于生成的方法逐字生成响应,缺乏全局视角导致语句与潜在响应(实体展开)之间的知识联系被忽略了,使得响应中生成的知识(实体)相对于语句而言是不合理的。最后,大多数以前的研究仅通过合并知识库中来丰富实体或三元组以进行生成响应,但是在输入语句确实很短的情况下,很难检索相关事实并产生有意义的响应。

为了解决上述挑战,论文提出了一种知识感知对话生成模型TransDG,该模型可以将知识库中的外部知识有效地融合到seq2seq模型中,从而通过迁移问题建模和知识匹配能力来生成信息性对话。

贡献

文章的主要贡献:

(1)提出了一种新颖的知识感知对话生成模型TransDG,该模型将问题理解和事实提取能力从预先训练的KBQA模型中转移出来,以促进事后理解能力和KB事实知识选择能力。

(2)提出了一种多步解码策略,该策略可以捕获信息和响应之间的知识联系。第一步解码器生成的语句和草稿响应均与KB的相关事实相匹配,这使得第二步解码器生成的最终响应相对于语句更为合适和合理。

(3)提出了一种响应指导注意机制,该机制利用k-最佳响应候选项引导模型关注相关特征。

(4)在真实对话数据集上进行的大量实验表明,从定量和定性的角度来看论文的模型均优于比较的方法。

模型

TransDG模型包含两个部分:KBQA模型和对话生成模型,其中从KBQA任务中学到的知识将在编码和解码阶段迁移到对话生成。

KBQA模型:

编码层

问题表示:采用BiGRU获取问题中单词的隐藏状态。同时为了更好地捕获单词的长期依赖关系,使用了依赖路径作为额外的表示,将单词和依赖项标签与方向连接起来,然后应用另一个BiGRU网络来获得依赖级别的问题表示。最后通过填充来对齐单词级和依赖级序列,并通过元素加来合并它们。

候选答案表示:KBQA任务中的候选答案表示为A = {a1, . . . , am},其中每个答案ai都是来自特定KB的事实,以三元组的形式存在。我们在字级和路径级对这些事实进行编码。

语义匹配与模型训练:通过多层感知器计算问题qi和候选答案aj之间的语义相似性评分,在训练过程中,采用hinge loss来最大化正答案集和负答案集之间的距离:

知识感知对话生成模型:

给定一个语句X = {x1, . . . , xn},对话生成的目标是生成一个适当的响应Y = {y1, . . . , ym},其中n和m分别表示语句和响应回答的长度。如模型图所示,对话生成模型从KBQA任务中传输知识,从而促进知识级别的对话理解和KB事实选择。

知识感知编码器:对话生成使用基于Seq2Seq的方法来生成给定语句的响应。Seq2Seq的编码器逐字读取语句 X,通过GRU生成每个单词的隐藏状态。此外,为了促进对语句的理解,通过迁移KBQA任务中的问题表示能力,来获得语句的多层语义理解(即单词级别和依赖级别)。即使用KBQA任务学习到的预训练双向GRU作为附加编码器。

响应指导注意机制:为了丰富语句表示以更好地理解,提出了一个响应引导注意机制,它使用检索到的类似语句的响应来引导模型只关注相关信息。

知识感知多步解码器:知识感知解码器采用多步解码策略,将从预先训练的KBQA模型中学习到的知识选择能力转化为响应。第一步解码器通过整合与语句相关的外部知识来生成草稿响应。第二步解码器通过参考第一步解码器产生的语句、上下文知识和草稿响应来生成最终响应。这样,多步译码器就可以捕捉到请求和响应之间的知识连接,从而产生更连贯、信息量更大的响应回答。

模型训练:模型以端到端的方式进行优化。 我们使用D表示训练数据集,并使用Θe,Θ1和Θ2分别表示编码器、第一步解码器和第二步解码器的参数。第一步解码的训练是为了最大程度地减少以下损失:

同样,通过最小化以下损失来优化第二步解码器:

最后,总损失为L(D1)和L(D2)之和。

实验

如下表2所示,TransDG在所有数据集上都实现了最低的困惑度,表明生成的响应更具语法性。

下表3证明,利用外部知识的模型在生成有意义的实体词和不同响应方面比标准Seq2Seq模型具有更好的性能,尤其是论文的模型以最高的实体得分明显优于所有基线。这验证了从KBQA任务迁移知识以进行事实知识选择的有效性。

表4中显示的BLEU值表明了字级重叠的比较结果。

表5列出了人类评估的结果,这表明TransDG倾向于在人类注释方面产生更适当的信息,即由TransDG生成的响应比其他模型具有更高的知识相关性,表明TransDG可有效地整合适当的常识知识。

表6展示了TransDG和基线方法生成的一些响应。

总结

本文提出了一种新的知识感知对话生成模型TransDG,一个迁移KBQA任务的话语表示和知识选择能力来整合常识知识的神经对话模型。此外还提出了一种响应引导注意机制,以增强编码器对输入后的理解,并通过多步解码来优化知识选择,以生成更适当和更有意义的响应。最后大量实验证明了该模型的有效性。


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478808.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

互联网企业数据安全体系建设

一、背景 Facebook数据泄露事件一度成为互联网行业的焦点,几百亿美元市值瞬间蒸发,这个代价足以在地球上养活一支绝对庞大的安全团队,甚至可以直接收购几家规模比较大的安全公司了。 虽然媒体上发表了很多谴责的言论,但实事求是地…

Android官方开发文档Training系列课程中文版:线程执行操作之创建多线程管理器

原文地址:http://android.xsoftlab.net/training/multiple-threads/create-threadpool.html 上节课我们学习了如何定义一个任务。如果只是执行单次任务,那么刚刚所学的已经基本满足要求了。如果需要针对不同的数据执行同种任务,并且需要同一…

NLP研究者必备的语言学书籍!

文 | Serena Gao知乎首先,做nlp不一定要很懂语言学,也不一定要跟语言学扯上关系。nlp可以仅是data mining,features engineering, 也的确有很多work目前在用文本或者对话做为数据集,然后用统计学方法实现目的,比如deep…

LeetCode 334. 递增的三元子序列

1. 题目 给定一个未排序的数组&#xff0c;判断这个数组中是否存在长度为 3 的递增子序列。 数学表达式如下: 如果存在这样的 i, j, k, 且满足 0 ≤ i < j < k ≤ n-1&#xff0c; 使得 arr[i] < arr[j] < arr[k] &#xff0c;返回 true ; 否则返回 false 。 说…

论文小综 | Neuro-Symbolic Reasoning in NLP

本文作者&#xff1a;邓淑敏&#xff0c;浙江大学在读博士&#xff0c;研究方向为低资源条件下知识图谱自动化构建关键技术研究。深度学习的高速发展使得模型的表达能力逐步完善&#xff0c;在一些感知任务&#xff08;例如动作识别和事件检测&#xff09;上取得了显著成果。但…

实时数据产品实践——美团大交通战场沙盘

背景 大数据时代&#xff0c;数据的重要性不言而喻&#xff0c;尤其对于互联网公司&#xff0c;随着业务的快速变化&#xff0c;商业模式的不断创新、用户体验个性化、实时化需求日益突出&#xff0c;海量数据实时处理在商业方面的需求越来越大。如何通过数据快速分析出用户的行…

Android官方开发文档Training系列课程中文版:线程执行操作之线程池操作

原文地址&#xff1a;http://android.xsoftlab.net/training/multiple-threads/run-code.html#StopThread 上节课我们学习了如何定义一个类用于管理线程以及任务。这节课将会学习如何在线程池中运行任务。要做到这一点&#xff0c;只需要往线程池的工作队列中添加任务即可。当…

谁才是Transformer家族中的最强王者?谷歌告诉你答案

文 | Sherry自从17年Attention is all you need发出&#xff0c;继而18年BERT刷新各大榜单&#xff0c;大型预训练Transformer似乎已经成为自然语言处理的标准基准模型&#xff0c;甚至进一步渗透到图像领域。各路大神基于Transformer提出了海量改进方法。这些改变是否对大多数…

LeetCode 652. 寻找重复的子树(DFS)

1. 题目 给定一棵二叉树&#xff0c;返回所有重复的子树。对于同一类的重复子树&#xff0c;你只需要返回其中任意一棵的根结点即可。 两棵树重复是指它们具有相同的结构以及相同的结点值。 示例 1&#xff1a;1/ \2 3/ / \4 2 4/4 下面是两个重复的子树&#xff1a…

论文浅尝 - CIKM2020 | Relation Reflection Entity Alignment

论文笔记整理&#xff1a;谭亦鸣&#xff0c;东南大学博士生。来源&#xff1a;CIKM 2020链接&#xff1a;https://arxiv.org/pdf/2008.07962.pdf研究背景与任务描述:实体对齐旨在基于已有对齐实体标注的情况下&#xff0c;确定不同KG中未知的对等实体&#xff0c;其本质是mult…

Android官方开发文档Training系列课程中文版:线程执行操作之线程间通讯

原文地址&#xff1a;http://android.xsoftlab.net/training/multiple-threads/communicate-ui.html 上节课我们学习了如何启动一项由ThreadPoolExecutor所管理的线程任务。最后这节课我们将学习如何从任务中发送结果数据给UI线程。这项手段可以使任务在执行完毕后将结果显示到…

SQL解析在美团的应用

数据库作为核心的基础组件&#xff0c;是需要重点保护的对象。任何一个线上的不慎操作&#xff0c;都有可能给数据库带来严重的故障&#xff0c;从而给业务造成巨大的损失。为了避免这种损失&#xff0c;一般会在管理上下功夫。比如为研发人员制定数据库开发规范&#xff1b;新…

无内鬼,来点ICML/ACL审稿人笑话

文 | Sheryc_王苏最近&#xff0c;如果你的小伙伴突然没时间陪你出来玩了&#xff0c;请不要担心&#xff0c;ta可能正在与ICML/IJCAI/ACL的审稿人斗智斗勇。过去的一周里&#xff0c;机器学习顶会ICML、人工智能顶会IJCAI和NLP顶会ACL扎堆放出审稿人意见&#xff0c;有人欢喜有…

Docx:docx.opc.exceptions.PackageNotFoundError: Package not found at

Docx:docx.opc.exceptions.PackageNotFoundError: Package not found at&#xff1a;https://blog.csdn.net/python__reported/article/details/106318330 Docx:docx.opc.exceptions.PackageNotFoundError: Package not found at 一、报错内容二、解决方法 一、报错内容 报错&a…

LeetCode 148. 排序链表(归并排序、快速排序)

文章目录1. 题目2. 解题2.1 归并排序2.2 快速排序1. 题目 在 O(n log n) 时间复杂度和常数级空间复杂度下&#xff0c;对链表进行排序。 示例 1:输入: 4->2->1->3 输出: 1->2->3->4 示例 2:输入: -1->5->3->4->0 输出: -1->0->3->4-&…

论文浅尝 | 基于对抗学习的弱监督知识图谱对齐

论文笔记整理&#xff1a;郭凌冰&#xff0c;浙江大学研究助理&#xff0c;研究方向为知识图谱的表示学习。绝大部分现有的知识图谱对齐方法都要求足够的已对齐三元组作为监督数据&#xff0c;但在现实世界中&#xff0c;获取大量的对齐三元组的代价十分高昂。本文提出一种同时…

美团数据平台Kerberos优化实战

背景 Kerberos 是一种网络认证协议&#xff0c;其设计目标是通过密钥系统为客户端、服务器端的应用程序提供强大的认证服务。 作为一种可信任的第三方认证服务&#xff0c;Kerberos是通过传统的密码技术&#xff08;如&#xff1a;共享密钥&#xff09;执行认证服务的&#xff…

Android官方开发文档Training系列课程中文版:如何避免ANR?

原文地址&#xff1a;http://android.xsoftlab.net/training/articles/perf-anr.html#anr 尽管你写代码可能通过了世界上所有的性能测试&#xff0c;但是它还是可能会让人感觉到卡顿。当应用卡的不成样子时&#xff0c;系统会给你弹一个”Application Not Responding”的对话框…

预训练语言模型真的是世界模型?

文 | 子龙自GPT、BERT问世以来&#xff0c;预训练语言模型在NLP领域大放异彩&#xff0c;刷新了无数榜单&#xff0c;成为当前学界业界的心头爱&#xff0c;其主体结构——Transformer——也在逐步的运用于其他领域的任务中&#xff0c;常见的如与CV的跨界&#xff0c;也有相对…

monk js_对象检测-使用Monk AI进行文档布局分析

原文链接&#xff1a;https://blog.csdn.net/weixin_26752075/article/details/108494230 monk js 计算机视觉 (Computer Vision) 介绍 (Introduction) This is an article on how Object Detection can help us in predicting various regions of a document. It can be usefu…