论文浅尝 | ISEEQ: 利用动态元信息检索和知识图谱的资讯搜索式问题生成器

f1d14f482c9385a5fd52bc1932ccfae2.png

笔记整理:侯哲衡,东南大学硕士,研究方向为知识图谱问答、自然语言生成。

动机

对话资讯搜索是在智能问答中一个新兴研究领域。对话资讯搜索旨在根据通过用户查询自动询问资讯搜索式问题(information-seeking questions,ISQs)、记录寻求资讯者的响应并根据响应来确定寻求资讯者的需求。这一领域现有的工作主要集中于根据寻求资讯者的响应检索相关上下文生成答案,缺少根据用户查询自动生成ISQs相关的研究。

根据用户查询自动生成ISQ的主要挑战在于用户查询往往是短而有限的,需要额外的知识生成用户需要的答案。ISQ与澄清式问题(Clarifying questions)不同的是,澄清式问题所关注的仅限于查询中的实体,而ISQ需要系统深入挖掘查询中的实体在知识图谱中的相互联系。同时,这一研究缺少相对应的高质量数据集。为了解决上述问题,文章提出了一个资讯搜索式问题生成器(Information SEEking Question generator,ISEEQ)。资讯搜索式问题生成器的设计思路主要来源于对三个问题的探索:

1.知识图谱/知识库是否可以帮助上下文检索和问题生成?2.ISEEQ生成的ISQs是否语义清晰,逻辑连贯?3.ISEEQ 能否跨领域场景中生成 ISQ?

贡献

文章的贡献有:

1.首次提出资讯搜索式问题生成这一任务并提供一种解决思路;2.对于用户查询,引入知识图谱增强查询进行上下文检索的过程;3.通过引入强化学习,增强生成问题的多样性和可读性;4.引入两个评估指标:“语义关联性”和“逻辑连贯性”评估生成ISQs的质量;

方法

⒈ 任务定义

输入为一个任意领域相关的短查询  。输出是一串资讯搜索式问题  。

⒉ 模型框架

如下图1所示为本文提出的ISEEQ模型框架。

3de820bdd32b2b5dd18d61b416087ec2.png

图1 ISEEQ模型框架

如图1所示,ISEEQ模型结合了基于BERT的解析器(蓝色),语义查询扩展模块(黄色)和知识感知上下文检索模块(绿色)帮助问题生成模型(橙色)生成的ISQ之间语义相关。问题生成模型则包含了 ISEEQ 两种变体:ISEEQ-RL 和 ISEEQ-ERL的结构。本文在强化学习环境中训练 ISEEQ,在生成 ISQ 的同时最大化语义关系和连贯性。

⒊ 语义查询扩展模块

本文借助常识知识图谱(CNetKG)扩展用户输入的短查询。首先使用 CNetKG 在用户查询描述 d 中提取实体集  。为此,文章使用预训练的基于自注意力编码器-解码器的选区解析器与 BERT 作为 ISEEQ 中的一致性编码器。解析器有条件的提取名词短语,这些名词短语捕获定义 IS 查询的候选实体。如果短语在 CNetKG 中有提及,则将它们称为实体 1。

然后在实体集  上,用深度优先搜索在 CNetKG 上执行多跳三元组(主体-实体、关系、对象-实体)提取。提取形式类似  和  的三元组,其中  。我们只保留那些   出现为主体实体的三元组。

通过这种启发式规则,可以(1)最小化噪音和 (2) 收集更多关于  中实体的直接信息。最后,文章通过注入提取的三元组来对输入 d进行文本化以获得一个知识增强的查询  。

⒋ 知识生成模块

给定知识增强的查询  ,知识增强模块从一个集合P中进行上下文检索并获取最优的K个上下文  。为此,文章对(Lewis et al. 2020)中描述的密集上下文检索器(DPR)进行了以下具体改进:(1)用于上下文p∈P 和k_d的 Sentence-BERT 编码器。我们使用 Sentence-BERT 创建 p∈P的密集编码,表示为  。同样,  的编码表示为   。(2) 结合SITQ (Simple locality sensitive hashing (Simple-LSH) and Iterative Quantization)算法,通过使用归一化实体分数(NES)来挑选top-K段落  。SITQ 是一种基于 MIPS 的快速近似搜索算法,用于检索和排列段落。这一算法可以被表示为一个分值,这个分值通过以下两个公式计算:

f60d2f7d269bdd20f6a348fbb35bebd9.png

c1a0068cd3bfe8036d069599c1e69bb0.png

知识生成模块在训练集中的每个查询至少有一个生成 ISQ 时停止迭代。

⒌ 问题生成模型

ISEEQ 利用   和  作为奖励函数在强化学习中学习 QG。ISEEQ使用T5作为生成模型,Electra-base作为鉴别模型学习资讯搜索式问题。

奖励函数:

ISEEQ-RL和ISEEQ-ERL中的奖励函数被定义为:

5100fe4d00a5b511ab40021ab86a7a77.png

ISEEQ-RL中的损失函数被定义为:

35013c50ed29e80c030c3d1cbb9500ad.png

ISEEQ-ERL中的损失函数被定义为:

524ea67aa6c75340c1af7a573849a236.png

c0367cf46bb3abdcd8bb5db2e302db04.png

实验

⑴. 实验细节

本文在多个数据集上进行了实验,这些数据集的具体指标如下表所示:

bca4afcca6be859275c1f90b5ecd45a1.png

图4 数据集指标

本文使用SQUADv2.0对模型进行微调。本文利用了Pytorch Lightning和Hugging Face transformer实现模型。模型参数使用python包ray进行调整,最终  ,   ,学习率设为1.17e-5。模型对每一轮迭代都进行了交叉验证,并根据不同的数据集迭代了100-120轮。

⑵. 实验结果

如下图3所示,与其他数据集相比,基于多上下文的问题生成比 TLMs-FT 中使用单上下文问题生成能产生更好的结果。

409b92f61163441ac308fc5e88d2a8b2.png

图3 ISEEQ与基线模型对比结果

另外,作者还进行了消融试验,测试了语义查询扩展模块的效果。效果如图4所示:

4c999cb9546dd729eacd16b7dcd8edc0.png

图4 语义查询扩展模块的消融试验

不仅如此,作者还通过人工评估测试了ISEEQ-ERL的效果,如图5所示:

58e8a7509fb423072be3d2f29116a211.png

图5 人工评估

总结

本文提出了一种根据用户查询自动生成资讯搜索式问题的方法,引入强化学习有效增强了生成的多个问题之间的语义关联性和逻辑连贯性。人工评估和自动评估指标皆表明,ISEEQ模型效果非常不错。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

5239659543f3758f49fcb524d512145c.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477701.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

浅谈点击信号对搜索的影响

文 | bytecoder源 | 知乎背景过去一周,我们探讨了搜索系统最核心的指标以及如何通过实验的方式来判断策略的好坏。但是影响一个实验的好坏除去策略本身的影响之外,还会受到一些反直觉的因素的影响;之前在做搜索,尤其是搜索系统成熟…

Spring Cloud Alibaba基础教程:支持的几种服务消费方式(RestTemplate、WebClient、Feign)

通过《Spring Cloud Alibaba基础教程:使用Nacos实现服务注册与发现》一文的学习,我们已经学会如何使用Nacos来实现服务的注册与发现,同时也介绍如何通过LoadBalancerClient接口来获取某个服务的具体实例,并根据实例信息来发起服务…

CCKS 2022 | 如何通过“说一句话”精准获取数据?恒生发布金融NL2SQL评测任务

某投资者登录券商理财APP,想要查找最近两年上市的公司,并按照最新的市值进行排序。然而他很难直接找到结果,需要经过层层筛选才能大致找到相关结果。有没有更简便的方式来查找数据?如果说一句话或者打一小段文字后,就能…

AI从业几年还不具备提出新模型的技术能力?看这个就够了!

AI是一门入门简单,但想深入却很难的学科,这也是为什么AI高端人才一直非常紧缺的重要原因。在AI领域技术领域,我们可以说机器学习功底决定了一个人的上限也不为过。为什么?机器学习就像物理学中的数学,如果你对数学没有…

Spring Cloud Alibaba基础教程:Nacos 生产级版本 0.8.0

昨晚Nacos社区发布了第一个生产级版本:0.8.0。由于该版本除了Bug修复之外,还提供了几个生产管理非常重要的特性,所以觉得还是有必要写一篇讲讲这次升级,在后续的文章中也都将以0.8.0版本为基础。 升级的理由 如Nacos官方的发布文…

LeetCode 1016. 子串能表示从 1 到 N 数字的二进制串(bitset)

1. 题目 给定一个二进制字符串 S(一个仅由若干 ‘0’ 和 ‘1’ 构成的字符串)和一个正整数 N,如果对于从 1 到 N 的每个整数 X,其二进制表示都是 S 的子串,就返回 true,否则返回 false。 示例 1&#xff…

论文浅尝 | KM-BART:用于视觉常识生成的知识增强多模态BART

笔记整理:陈子强,天津大学硕士动机视觉语言模型早期集中在纯理解任务(例如,VQA视觉问答),尽管在理解任务上取得了先进的性能,却很少关注多模态生成任务。当前的预训练任务例如,掩码语…

AllenAI | 用GPT-3帮助增建数据,NLI任务直接提升十个点!?

文 | iven编 | 小轶用机器构建数据集,这件事可能比机器学习诞生的还要早,很多人做过很多工作。怎样让机器参与进来?前人的工作可以分成两类思路:一类是以远程监督为代表,让机器来标注,主要目的在于得到更多…

论文浅尝 | CLIP-Event: 用事件结构连接文本和图像

笔记整理:康婧淇,东南大学硕士,研究方向为多模态事件抽取、自然语言处理。动机视觉语言预训练模型通过理解图像和文本之间的排列组合,在支持多媒体应用方面取得了巨大成功。虽然现有的视觉语言预训练模型主要侧重于理解图像中的物…

LeetCode 402. 移掉K位数字(贪心,单调栈)

1. 题目 给定一个以字符串表示的非负整数 num,移除这个数中的 k 位数字,使得剩下的数字最小。 注意: num 的长度小于 10002 且 ≥ k。 num 不会包含任何前导零。 示例 1 : 输入: num "1432219", k 3 输出: "1219" 解释: 移除掉…

Spring Cloud Alibaba基础教程:使用Nacos实现服务注册与发现

自Spring Cloud Alibaba发布第一个Release以来,就备受国内开发者的高度关注。虽然Spring Cloud Alibaba还没能纳入Spring Cloud的主版本管理中,但是凭借阿里中间件团队的背景,还是得到不少团队的支持;同时,由于Spring …

忙累了躺平,躺醒后该干点啥

文 | 一只菜鸡前几天刷到 微调 的一些碎碎念,觉得自己的2021年还是有蛮多收获的,于是在各位卖萌屋小伙伴的鼓励下,就有了本文。收获很多,我从中挑选出来自我感觉对读者来说比较有用的三点。1. 放低期待,学会适当躺平我…

论文浅尝 | P-Adapters: 从具有不同提示的语言模型中鲁棒地提取事实信息

笔记整理:田玺,浙江大学硕士研究生。研究方向:知识图谱、自然语言处理论文地址:https://openreview.net/forum?idDhzIU48OcZh,录用于ICLR2022摘要之前的工作发现,从大型语言模型(LLMs&#xff…

LeetCode 470. 用 Rand7() 实现 Rand10()(随机概率)

1. 题目 已有方法 rand7 可生成 1 到 7 范围内的均匀随机整数,试写一个方法 rand10 生成 1 到 10 范围内的均匀随机整数。 不要使用系统的 Math.random() 方法。 示例 1: 输入: 1 输出: [7]示例 2: 输入: 2 输出: [8,4]示例 3: 输入: 3 输出: [8,1,10]提示: rand…

Spring Cloud Stream同一通道根据消息内容分发不同的消费逻辑

应用场景 有的时候,我们对于同一通道中的消息处理,会通过判断头信息或者消息内容来做一些差异化处理,比如:可能在消息头信息中带入消息版本号,然后通过if判断来执行不同的处理逻辑,其代码结构可能是这样的…

图谱实战 | 再谈图谱表示:图网络表示GE与知识图谱表示KGE的原理对比与实操效果分析...

转载公众号 | 老刘说NLP知识图谱嵌入是一个经典话题,在之前的文章《知识表示技术:图谱表示VS图网络表示及基于距离函数的表示学习总结》中,围绕知识图谱嵌入学习这一主题,对比了知识图谱嵌入与图网络嵌入的异同。而在实际工作中&a…

LeetCode 1247. 交换字符使得字符串相同

1. 题目 有两个长度相同的字符串 s1 和 s2,且它们其中 只含有 字符 “x” 和 “y”,你需要通过「交换字符」的方式使这两个字符串相同。 每次「交换字符」的时候,你都可以在两个字符串中各选一个字符进行交换。 交换只能发生在两个不同的字…

图深度学习前沿工作汇总与解析

图深度学习除了可以应用于标准图推理任务以外,还广泛应用于推荐、疾病或药物预测、自然语言处理、计算机视觉、交通预测等领域。可见,基于图的深度学习不仅有助于挖掘现有图数据背后的丰富价值,而且还通过将关系数据自然地建模为图&#xff0…

Spring Cloud Stream消费失败后的处理策略(四):重新入队(RabbitMQ)

应用场景 之前我们已经通过《Spring Cloud Stream消费失败后的处理策略(一):自动重试》一文介绍了Spring Cloud Stream默认的消息重试功能。本文将介绍RabbitMQ的binder提供的另外一种重试功能:重新入队。 动手试试 准备一个会…

图谱实战 | 华农夏静波:深层语义知识图谱在药物重定位中的应用

转载公众号 | DataFunSummit分享嘉宾:夏静波 华中农业大学 副教授编辑整理:王金华 电科32所出品平台:DataFunTalk导读:自新冠病毒肺炎疫情发生以来,由于传统药物研发周期长,药物重定位(老药新用…