论文浅尝 - EMNLP2020 | 基于规则引导的协作 agent 知识图谱推理学习

论文笔记整理:叶橄强,浙江大学在读硕士,研究方向为知识图谱的表示学习和预训练。


来源:EMNLP 2020

现有的大多数基于行走的模型通过在提供可解释的决策的同时获得良好的性能,在知识图谱推理中显示出其优势。但在遍历过程中提供的稀疏奖赏信号往往不足以指导复杂的基于行走的强化学习模型。

另一方面使用传统的符号方法,如规则归纳法,这些方法虽然性能良好,但由于符号表示的局限性而难以推广。

本文提出了规则引导器RuleGuider,一方面利用基于符号的方法生成的高质量规则,另一方面高质量规则为基于行走的代理提供奖励监督。

RuleGuider由两个部分组成,一个是基于符号的方法,称为规则挖掘器rule miner;另一个是基于路径的方法,称为agent。规则挖掘器rule miner首先挖掘逻辑规则,agent在规则的指导下,通过奖励来学习推理路径的概率分布。

代理部分agent分为两个子代理:关系代理和实体代理,这两个代理结构相互作用生成路径。

在每个步骤中,实体代理首先从有效实体中选择一个实体,然后关系代理将基于所选实体抽样一个关系,最后他们基于最后选择实体的命中奖励和基于所选路径的预挖掘规则集的规则指导奖励。实体代理和关系代理可以参考如下模型结构图

(1)关系代理Relation Agent

对于给定的查询语句,关系代理选择一个关联到当前实体et−1的关系rt,这个过程可以用公式描述为,其中rq表示需要查询的关系,R为挖掘出来的规则集合,是之前每一步挑选出来的关系历史。

因此,关系代理既利用了预先挖掘的规则的置信度得分,也利用了嵌入向量提供的语义信息来获得命中奖励。

(2)实体代理Entity Agent

类似于关系代理,实体代理模型会基于头实体es生成所有候选实体的分布,这个过程可以被形式化为,其中rq表示需要查询的关系,rt表示从关系代理中获取当前第t步骤的关系。

(3)策略网络Policy Network

关系代理的搜索策略可以通过嵌入向量rq来参数化,其中后者是关系历史,通过长短期记忆神经网络LSTM来计算,其中是最后一个关系的嵌入向量,是之前的历史关系。于是可以得到关系代理输出概率分布:

其中σ是softmax运算符,W1和W2是可训练参数。因此,关系代理的历史依赖策略可以表示为

类似地,实体的概率分布可以表示为

实体代理的历史依赖策略可以表示为

(4)训练奖励

规则引导奖励Rr:给定一个查询,关系代理会选择指向正确对象实体的路径。因此,在给定一条关系路径的情况下,我们根据其从规则挖掘器中获取的信任度给予奖励,称为规则引导奖励

命中奖励Rh:还将获得命中奖励Rh,如果预测的三元组在知识图谱中,则其值为1。

训练过程分四个阶段训练模型。

1) 使用基于嵌入embedding的方法训练关系和实体嵌入向量。

2) 应用规则挖掘器来检索规则及其相关的可信度分数。

3) 通过冻结实体代理并请求关系代理采样路径来预训练关系代理。只使用规则挖掘器来评估路径,并根据预先挖掘的置信度计算Rr。

4) 联合训练关系和实体代理来利用嵌入来计算相对湿度。

最终整合规则引导奖励Rr和命中奖励Rh 并为其加入系数为λ:,并使用强化学习算法训练两个代理的策略网络,使最终的汇报R最大化

实验

实验部分作者做了三类实验,包括三个数据集上的知识图谱链接预测,模型各个和人工评估推导的规则合理性这些实验。实验结果如下:

RuleGuider在WN18RR和NELL-995上实现了不错的效果,但在FB15k-237数据集上也效果有限。一个可能的原因是:与其他两个数据集相比,FB15k-237中的关系空间要大得多,而在大的关系路径空间中,规则相对稀疏,这使得关系代理难以选择所需的规则。

另外与基于行走路径的方法相比,基于嵌入的方法尽管相对简单但在所有数据集上都具有一贯的良好性能,很可能是因为基于嵌入向量的方法将整个图的结构信息隐式编码到嵌入空间中。

 

为了验证模型各个部分的有效性,文章设计了不同的RuleGuider模型变体来验证试验:Freeze模型,冻结了预训练的关系代理部分;No模型,没有预先训练部分;Single模型,没有分离agent。

Freeze模型与本文模型比较,冻结预先训练过的agent代理效果较差,表现差表明命中奖励是必要的。No模型与本文模型比较,去掉预训练表现的结果较差,说明基于行走的智能体受益于逻辑规则。Single模型与本文模型比较性能较差,说明了剪枝动作空间的有效性。

除了评估链接预测指标和模型变体外,本文还进一步分析导致正确预测实体的推理路径是否合理。文章在FB15k-237上使用均匀分布从开发集随机抽取300个三元组的评估集。,对于给定正确的三元组,三个实验者被要求选择以下哪条路径是更好的解释/分解它之间的:(1)由本文方法生成的路径;(2)由多跳方法Multihop生成的路径;(3)抽签或没有一个是合理的。对于每个三元组,以多数票作为评估结果。从表4中可以看出,与具有复杂奖赏成形的多跳算法相比,规则引导器RuleGuider具有更好的性能,推理路径对可解释性更有意义。


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478571.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Shield——开源的移动端页面模块化开发框架

一直以来,如何能更高效地开发与维护页面是Android与iOS开发同学最主要的工作和最关心的问题。随着业务的不断发展,根据特定业务场景产生的定制化需求变得越来越多。单一页面往往需要根据不同业务、不同场景甚至不同用户展示不同的内容。在这样的背景下&a…

1年排名前进13位 ,这个论题成顶会新宠!

写过论文的同学都知道,写久了真的会头秃,其中耗发量最高的当属论题和创新点。今天分享一套方法,这个方法已经帮助近3000位同学成功发(拯)表(救)论(头)文(发&a…

字典树介绍

方法介绍 1.1、什么是Trie树 Trie树,即字典树,又称单词查找树或键树,是一种树形结构。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是最大限…

LeetCode 50. Pow(x, n)(二分查找)

文章目录1. 题目2. 二分查找2.1 递归2.2 循环1. 题目 实现 pow(x, n) &#xff0c;即计算 x 的 n 次幂函数。 示例 输入: 2.00000, 10 输出: 1024.00000 示例 输入: 2.00000, -2 输出: 0.25000 解释: 2-2 1/22 1/4 0.25 说明: -100.0 < x < 100.0 n 是 32 位有符号…

OpenKG 祝大家 2021 新年快乐 —「2020 精选文章汇编」

过去的一年是不寻常的一年&#xff0c;虽然疫情改变了所有人的生活&#xff0c;但是它并没有击垮我们。这一年&#xff0c;大家依旧保持着开源开放的精神&#xff0c;持续地分享着知识图谱领域的技术动态、应用实践&#xff0c;同学们也持续不断地输出优质的论文笔记。OpenKG 继…

智能分析最佳实践——指标逻辑树

所有业务都会面对“为什么涨、为什么降、原因是什么&#xff1f;”这种简单粗暴又不易定位的业务问题。为了找出数据发生异动的原因&#xff0c;业务人员会通过使用多维查询、dashboard等数据产品锁定问题&#xff0c;再辅助人工分析查找问题原因&#xff0c;这个过程通常需要一…

论文浅尝 - EMNLP2020 | 图结构对于多跳问答而言必要吗?

笔记整理 | 陈卓&#xff0c;浙江大学计算机科学与技术系&#xff0c;博士研究生研究方向 | 知识图谱&#xff0c;图神经网络&#xff0c;多模态论文链接&#xff1a;https://www.aclweb.org/anthology/2020.emnlp-main.583.pdf发表会议&#xff1a;EMNLP 2020背景提要抽取式阅…

为什么每次有人大声通电话时,我就很烦躁...

文 | Chaos编 | 小戏不知你是否有过这样的体验&#xff0c;当你周围有人在大声讲电话时&#xff0c;你会不自觉的感觉到烦躁。为什么呢&#xff1f;有一种委婉的说法是因为你听到了不完整的对话。直白点说其实就是讲电话的人通过放大声音强行让你接收了他说的信息&#xff0c;但…

LeetCode 367. 有效的完全平方数(二分查找)

1. 题目 给定一个正整数 num&#xff0c;编写一个函数&#xff0c;如果 num 是一个完全平方数&#xff0c;则返回 True&#xff0c;否则返回 False。 说明&#xff1a;不要使用任何内置的库函数&#xff0c;如 sqrt。 示例 1&#xff1a; 输入&#xff1a;16 输出&#xff1…

美团点评联盟广告场景化定向排序机制

在美团点评的联盟广告投放系统&#xff08;DSP&#xff09;中&#xff0c;广告从召回到曝光的过程需要经历粗排、精排和竞价及反作弊等阶段。其中精排是使用CTR预估模型进行排序&#xff0c;由于召回的候选集合较多&#xff0c;出于工程性能上的考虑&#xff0c;不能一次性在精…

论文浅尝 - COLING2020 | 一种用于跨语言实体对齐的上下文对齐强化跨图谱注意力网络...

笔记整理 | 谭亦鸣&#xff0c;东南大学博士生来源&#xff1a;COLING 2020链接&#xff1a;https://www.aclweb.org/anthology/2020.coling-main.520.pdf本文发现&#xff0c;目前基于GCN的对齐方法都是分别考虑两个KG&#xff0c;然后分别学习它们的embedding&#xff0c;并认…

LeetCode 744. 寻找比目标字母大的最小字母(二分查找)

1. 题目 给定一个只包含小写字母的有序数组letters 和一个目标字母 target&#xff0c;寻找有序数组里面比目标字母大的最小字母。 数组里字母的顺序是循环的。举个例子&#xff0c;如果目标字母target ‘z’ 并且有序数组为 letters [‘a’, ‘b’]&#xff0c;则答案返回…

NLP 综述的综述

NLP 综述的综述&#xff1a;https://mp.weixin.qq.com/s/3DvXDLFQJnIrXFWVGowTjw

超越YOLOv5,1.3M超轻量,高效易用,这个目标检测开源项目太香了!

这个目标检测神器简直香炸了&#xff01;它不仅连续登录Github全球趋势榜&#xff0c;拥有的全球尖端算法论文也接连登录全球技术趋势榜PaperWithCode。这个神器就是刚刚全面升级的PaddleDetection2.0&#xff01;它全面兼顾高性能算法、便捷开发、高效训练及完备部署&#xff…

MyFlash——美团点评的开源MySQL闪回工具

由于运维、DBA的误操作或是业务bug&#xff0c;我们在操作中时不时会出现误删除数据情况。早期要想恢复数据&#xff0c;只能让业务人员根据线上操作日志&#xff0c;构造误删除的数据&#xff0c;或者DBA使用binlog和备份的方式恢复数据&#xff0c;不管那种&#xff0c;都非常…

论文浅尝 - ACL2020 | 用于多媒体事件提取的跨媒体结构化公共空间

笔记整理 | 王琰&#xff0c;东南大学来源&#xff1a;ACL 2020链接&#xff1a;https://arxiv.org/pdf/2005.02472.pdf概述本论文引入一项新任务&#xff1a;多媒体事件提取&#xff08;ME&#xff09;&#xff0c;该任务旨在从多模态中抽取出事件和其论点(M2E2)。此外&#x…

屠榜CV还不是这篇论文的终极目标,它更大的目标其实是……

文 | 魏旭编 | 橙橙子&#xff0c;小戏当 BERT 模型出来之后&#xff0c;Transformer 架构基本成为 NLP 任务的底色。诸如 Roberta、XLNet、ELECTRA、GPT3 等刷榜各类 NLP 任务的模型&#xff0c;无一不是基于 Transformer 框架。无疑&#xff0c;Transformer 开启了 NLP 的统治…

day01『NLP打卡营』实践课1:词向量应用演示

Day01 词向量作业辅导 本教程旨在辅导同学如何完成 AI Studio课程——『NLP打卡营』实践课1&#xff1a;词向量应用展示 课后作业。 1. 选择词向量预训练模型 在PaddleNLP 中文Embedding模型查询PaddleNLP所支持的中文预训练模型。选择其中一个模型&#xff0c;如中文维基百…

流计算框架 Flink 与 Storm 的性能对比

1. 背景 Apache Flink 和 Apache Storm 是当前业界广泛使用的两个分布式实时计算框架。其中 Apache Storm&#xff08;以下简称“Storm”&#xff09;在美团点评实时计算业务中已有较为成熟的运用&#xff08;可参考 Storm 的可靠性保证测试&#xff09;&#xff0c;有管理平台…