论文浅尝 - ICML2020 | 基于子图推理的归纳式关系预测

论文笔记整理:陈名杨,浙江大学在读博士生,主要研究方向为知识图谱表示学习。




论文来源:ICML 2020

Introduction

当前在知识图谱上(KnowledgeGraph,KG)进行关系预测的很多方法都依靠在对知识图谱中的实体和关系都学习一个潜在的表示(Latent Representation)也就是嵌入(Embedding)。但是这种方法一般来说有两个缺点,第一,这一类基于嵌入的方法并没有显式对捕获知识图谱中的规则;第二,这一类方法需要对所有的实体都学习一个表示,仅仅局限于transductive的设定,也就是说,只能对训练集中见过的并且已经学习过表示的实体进行关系预测,而无法在inductive的场景,也就是归纳式的场景下,对在训练集中没有见过的实体进行关系预测。这篇论文提出一种基于图神经网络(Graph Neural Network,GNN)的关系预测框架Graph Inductive Learning(GraIL)来解决在知识图谱上进行归纳式关系预测的问题。

下面图1中对transductive和inductive的推理进行举例,简单来说inductive可以处理在训练的时候没有见过的实体而transductive则不行。

图1 Transductive和Inductive推理举例

       那么如何才能进行归纳式的关系推理。换一个角度看,关系推理可以是一个逻辑归纳的问题,也就是如何从已有的知识图谱中归纳出关系并且在预测的时候利用关系。下图2中是一个规则的示例。当模型可以捕获到规则的信息,那么就可以对没有见过的实体进行关系预测了。

图2 规则示例

Method

模型设计的是让该模型可以捕获到KG中潜在的规则,而不用对每一个实体学习一个专门的表示。这里的假设是对于两个需要被预测关系的目标节点(目标实体),它们之间的路径包含了被预测关系的信息。整个模型分为三个步骤

1.对于两个目标关系,采样出它们之间的周围局部路径图结构;

2.对局部图中的节点的表示进行初始化,初始化中包含了相关的结构信息;

3.利用图神经网络进行消息传递,利用得到的节点表示和整个局部图表示进行关系预测。

图3是模型整体示例,下面将对每个步骤进行解释。

图3 模型整体示例

      

       子图挖掘(SubgraphExtraction)。对两个目标节点,取它们周围k-hop的周围子图,然后对两个子图求交集,最终去掉独立的点以及与两个点距离大于k的点。这样的操作可以得到在两个目标节点距离最长k+1的所有路径作为子图。

       节点标签(NodeLabeling)。图神经网络的操作一般需要节点具有特征表示作为初始化,但在这里假设没有任何KG的特征表示。这里通过度量每个点和目标节点的距离对节点进行表示,例如对于目标节点为u, v的子图,其中的一点i,用一个元组(d(i, u), d(i, v))表示,其中d(. , .)表示两点最短距离。特别的u, v两点分别以(0, 1),(1, 0)进行表示。节点的初始化特征表示就用对该特征的one-hot编码进行表示。

       利用图神经网络打分(GNNScoring)。这里借鉴了R-GCN的方法来建模对多关系图的消息传递,区别在于增加了一个注意力机制,该注意力机制不仅仅和两个相邻节点以及它们之间的关系有关,也和需要被预测的目标关系有关。最终利用两个目标节点的表示,整个图的表示,以及被预测被预测关系的表示,对该目标节点之间具有该目标关系进行打分,得分最高的目标关系为被预测关系。

Experiments

作者在本文中将该方法和一些其他可以利用与归纳式关系预测场景的方法在标准数据集上进行对比,得到如下结果。

同时作者也在transductive的场景下进行实验,将该模型和一般的KGE模型进行融合说明其方法带来的提升。

       同时,作者还对模型进行消融实验(AblationStudy)来说明各部分的有效性。

Conclusion

这篇文章提出了一种模型可以解决在知识图谱下的归纳式关系预测(InductiveRelation Prediction)。区别于一般的基于嵌入的方法,该方法并不是对每一个实体学习一个表示,则可以处理没有见过的实体。文章的实验证明了作者的观点,inductive relation prediction的方法也有很多值得挖掘的地方。


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478716.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CVPR 二十年,影响力最大的 10 篇论文!

文 | 二玖极市平台此前,极市盘点了图像分割在过去二十年中影响力最大的10篇论文,得到了许多开发者的支持。今天,我们将对计算机视觉领域三大顶会之一CVPR在近二十年来中产生的优秀论文进行一个全面的盘点与总结。CVPR是计算机视觉领域三大顶会…

DataMan-美团旅行数据质量监管平台实践

背景 数据,已经成为互联网企业非常依赖的新型重要资产。数据质量的好坏直接关系到信息的精准度,也影响到企业的生存和竞争力。Michael Hammer(《Reengineering the Corporation》一书的作者)曾说过,看起来不起眼的数据…

jupyter notebook切换到其他配置好的conda虚拟环境

1 手把手教你如何把jupyter notebook切换到其他配置好的conda虚拟环境 https://blog.csdn.net/weixin_41813895/article/details/84750990 2 Jupyter notebook切换Python环境 https://www.jianshu.com/p/8188c32a3a34

LeetCode 133. 克隆图(图的BFS/DFS)

1. 题目 给定无向连通图中一个节点的引用&#xff0c;返回该图的深拷贝&#xff08;克隆&#xff09;。图中的每个节点都包含它的值 val&#xff08;Int&#xff09; 和其邻居的列表&#xff08;list[Node]&#xff09;。 class Node { public:int val;vector<Node*> n…

七天搞定java接口自动化测试实战,一文搞定...

前言 无论是自动化测试还是自动化部署&#xff0c;撸码肯定少不了&#xff0c;所以下面的基于java语言的接口自动化测试&#xff0c;要想在业务上实现接口自动化&#xff0c;前提是要有一定的java基础。 如果没有java基础&#xff0c;也没关系。这里小编也为大家提供了一套jav…

Android自动化测试探索

前言 通常来说&#xff0c;我们开发完成产品之后&#xff0c;都是由测试组或者是我们自己点一点&#xff0c;基本上没有问题了就开始上线。但是&#xff0c;随着时间的堆叠&#xff0c;一款产品的功能也越来越多。这时&#xff0c;我们为了保证产品的质量&#xff0c;就需要在…

我整理了100道大厂算法岗面试必考题!

最近&#xff0c;很多小伙伴给我留言去面试被面试官吊打了&#xff0c;尤其是一些去面大厂的朋友&#xff0c;甚至一面都没有过...来&#xff0c;别灰心&#xff0c;我以过往经验告诉你大厂面试的通关秘诀&#xff01;对&#xff0c;就是算法&#xff01;大厂面试必考算法&…

参会邀请 - ISWC2020 | 第十九届国际语义网会议

第十九届国际语义网会议&#xff08;ISWC2020&#xff09;将于11月1日至6日远程召开。国际语义网会议是全球最重要的且最有影响力的国际学术会议&#xff0c;主要聚焦语义网&#xff0c;知识图谱&#xff0c;本体&#xff0c;链接数据等面向互联网的人工智能技术。国际语义网会…

美团配送资金安全治理之对账体系建设

前言 随着美团配送业务的飞速发展&#xff0c;单量已经达到千万级别&#xff0c;同时每天产生的资金额已经超过几千万&#xff0c;清结算系统在保证线上服务稳定可靠的前提下&#xff0c;如何系统化的保障资金安全是非常核心且重要的课题&#xff0c;配送清结算系统经过近3年的…

Githug第42关rebase_onto通关秘籍

Githug是一个用来了解、熟悉Git的一个非常好的游戏。 目前网站上收录的都是之前只有55关的解题方法&#xff0c;没有新增的rebase_onto这一关的内容。现在Githug一共有56关。现将新增的42关的解答内容更新如下&#xff1a; 第42关的题目如下: Name: rebase_onto Level: 41 D…

gcc安装不行的解决办法,需更新apt-get

上面应该更新apt-get 更新之后&#xff0c;重新安装gcc成功

LeetCode 138. 复制带随机指针的链表(哈希 / 深拷贝)

1. 题目 给定一个链表&#xff0c;每个节点包含一个额外增加的随机指针&#xff0c;该指针可以指向链表中的任何节点或空节点。 要求返回这个链表的深拷贝。 《剑指Offer》同题&#xff1a;面试题35. 复杂链表的复制 2. 解题 类似题目&#xff1a;LeetCode 1484. 克隆含随…

论文浅尝 - COLING2020 | 桥接文本和知识的多原型嵌入在少样本关系三元组抽取中的研究...

本文转载自公众号&#xff1a;浙大KG。 论文题目&#xff1a;Bridging Text and Knowledge with Multi-Prototype Embedding for Few-Shot Relational Triple Extraction本文作者&#xff1a;余海阳发表会议&#xff1a;COLING 2020论文链接&#xff1a;https://person.zju.…

惊呆!不用一张图片,却训出个图像识别SOTA?

文 &#xff5c; 橙橙子如果老板派给你一个任务&#xff0c;不使用一张图片&#xff0c;让你训练一个视觉预训练模型&#xff0c;你会不会觉得老板疯了。最近有一篇论文&#xff0c;不仅没用一张真实图片和标注&#xff0c;还训练出个媲美SOTA的效果&#xff0c;甚至超过了MoCo…

LeetCode 797. 所有可能的路径(DFS)

1. 题目 给一个有 n 个结点的有向无环图&#xff0c;找到所有从 0 到 n-1 的路径并输出&#xff08;不要求按顺序&#xff09; 二维数组的第 i 个数组中的单元都表示有向图中 i 号结点所能到达的下一些结点&#xff08;译者注&#xff1a;有向图是有方向的&#xff0c;即规定…

每天数百亿用户行为数据,美团点评怎么实现秒级转化分析?

背景 用户行为分析是数据分析中非常重要的一项内容&#xff0c;在统计活跃用户&#xff0c;分析留存和转化率&#xff0c;改进产品体验、推动用户增长等领域有重要作用。美团点评每天收集的用户行为日志达到数百亿条&#xff0c;如何在海量数据集上实现对用户行为的快速灵活分析…

EventBus1.0.1源码解析

很久没有更新过源码解析类文章&#xff0c;以下内容作为源码分析类的笔记。分析方法适用于其它源码分析。 分析工具说明 许久以来&#xff0c;阅读源代码最得力的工具就非Source Insight莫属了。然&#xff0c;后来微软出了一款轻量级但功能强大的IDE就没Source Insight什么事…

pycharm插件之SonarLint

pycharm插件之SonarLint pycharm插件之SonarLint 一、插件安装位置 1、在线安装插件 通过File—>Settings—>Plugins进行安装插件&#xff0c;然后只需要重新启动IEDA即可。 2、离线安装插件 通过 Settings > Plugins > Install Plugin from 离线安装&#x…

论文浅尝 - ICLR2020 | You Can Teach an Old Dog New Tricks!关于训练知识图谱嵌入

论文笔记整理&#xff1a;谭亦鸣&#xff0c;东南大学博士生。来源&#xff1a;ICLR2020链接&#xff1a;https://openreview.net/pdf?idBkxSmlBFvrKG embedding&#xff08;KGE&#xff09;模型的目标是学习知识图谱中实体和关系的向量表示。近年来众多的KGE方法被提出&#…

撑起百万亿参数模型想象力!英伟达发布新一代SuperPOD超算,AI算力新巅峰!

周一&#xff0c;黄教主又很淡定的在自家厨房里开完了GTC发布会。众所周知&#xff0c;NLP领域的模型一个比一个大&#xff0c;自从百亿参数的Google T5出来后&#xff0c;大部分AI研究者只能望着手里的蹩脚算力兴叹。如今动辄就是千亿、万亿参数模型&#xff0c;目前比较流行的…