网站与网页移动商城官网 积分兑换
news/
2025/9/24 10:14:47/
文章来源:
网站与网页,移动商城官网 积分兑换,wordpress 英文主题,天津定制网络营销公司论文笔记整理#xff1a;谭亦鸣#xff0c;东南大学博士生。来源#xff1a;WWW 2020链接#xff1a;https://dl.acm.org/doi/pdf/10.1145/3366423.3380114概述这篇论文关注的任务是#xff1a;基于给定文本的“多跳问题生成”#xff08;多关系问题#xff09;。作者提… 论文笔记整理谭亦鸣东南大学博士生。来源WWW 2020链接https://dl.acm.org/doi/pdf/10.1145/3366423.3380114概述这篇论文关注的任务是基于给定文本的“多跳问题生成”多关系问题。作者提出的方法大致可以描述为1.基于实体的上下文关系将分布于文本中的实体融合为一个实体图2.通过证据关系及类型从实体图中抽取子图构成推理链同时也获得对应的局部文本信息3.基于推理链构建了一个整合的“生成-评价”网络模型实现多跳问题的生成。其中作者将生成过程生成器设计为一个强化了问题句法和语义合理性的seq2seq模型在评价方面作者通过建立一个混合监督学习与强化学习的评价机制同时用于生成模型的优化。本工作使用的数据集为HotpotQA问题生成方法的主要作用是构建伪训练标注集用于弥补数据集不足的问题。背景与动机本工作主要关联的一个NLP是多跳机器阅读理解即使机器完全理解文本语义并回答一般的问题尤其是需要学习推理。因此这里的问题生成主要基于包含多实体/关系的文本数据。从现有的问题生成方法上看1. 基于模板的方法受限于手写模板对于问题类型的覆盖能力2. 目前的 seq2seq 问题生成方法无法捕获和合成多个句子之间的证据evidence本质上连续的relation。个人认为真实情况下这里应该隐含一个问题“多个文本句子之间的指代消解问题”但是从后文的方法和实验来看数据样本中并没有遇到这样的挑战因此基于上述现有挑战作者提出了本文问题生成方法。方法图2是本文问题生成方法的一个过程示意图其中主要的部分是1.实体图用于捕获实体以及它们的上下文关系从给定的文本中。接着从实体图中找到一些证据性关系构成推理链这步着实关键启发式的从文本中抽取与回答问题相关的部分(包括1.答案推理类型证据实体和实体的句子)2.整合的生成评价网络生成器首先抓取推理链上的证据关系使用GCN使用一个seq2seq网络生成问题基于抽取的上下文。同时伴随一些类后处理机制重复词生成错误的答案相关词无关词的复制与答案类型无关的疑问词评价器首先基于监督损失进行预训练而后通过混合的监督与强化学习损失做fine-tune问题生成的过程可以看作其中Y是生成的问题A是答案B是给定文本。Y{y1,y2,…,yt} 生成的问题长度为t因此也可以表示为对每个生成词的条件概率最大化。实体图的具体构建过程是:首先使用Stranford CoreNLP toolkit 确定句子中的实体及类型人地点代词以及它们的上下文句子中的相同实体包括指代重复出现部分出现复述使用序列相似度确定得到实体图之后作者设计了三种类型的子图抽取规则Sequence需要使用证据实体充当序列链从问题到答案的桥梁Interp交集从sequence的中间截取answerComparison比较型问题图4是整个模型的框架图可以看到各个步骤中具体使用到的编码和解码网络类型以及评价使用的混合损失函数与reward作者在原文中详细的描述了各个部分运算的过程这里就不赘述了模型的主要输入是1. 推理链2.相关实体上下文句子答案实验及结果实验部分作者首先分析了数据集规模对MRC-QA(机器阅读理解问答)模型的影响如图5所示显然更大规模的达到一定质量的训练集往往带来更好的性能。作者收集了现有的MRC-QA方法并给出了它们的性能对比表1接着在DFGNSOAT模型上使用QG方法进行了改进图6。接着作者对比了不同问题类型上方法的效果表2以及本文QG方法与其他SOATQG方法的统计对比表3 OpenKG开放知识图谱简称 OpenKG旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。点击阅读原文进入 OpenKG 网站。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/915541.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!