论文浅尝 | Rot-Pro:通过知识图谱嵌入中的投影建模关系的传递性

c490f56779c77edd4c48889c59d767e3.png

笔记整理:陈湘楠,浙江大学硕士在读。

研究背景

知识图嵌入模型学习知识图谱中实体和关系的表示,以预测实体之间的缺失链接(关系)。它们的有效性深受建模和推断不同关系模式(如对称、不对称、逆向、组合和传递性)的能力的影响。已经有许多工作尝试找到一种方法来统一建模这些不同的关系模式。如:TransE可以建模逆向和组成的关系模式;DistMult可以处理对称关系;以及最近提出的模型RotatE通过将关系看作在复数空间中的旋转因子,可以同时处理对称、非对称、逆向、组合这四种关系模式。

研究动机

尽管已有很多工作可以对不同的关系模式进行建模,但是针对传递性这一关系模式,目前还没有模型可以处理。由此,这篇论文首先通过理论证明关系的传递性可以利用投影变换来建模,并且提出了一种将投影和关系旋转相结合的模型Rot-Pro,在多个数据集上验证了其有效性。

研究方法

假设关系r是一种转换方式Tr,那么对于任何一个三元组(h, r, t)。都需满足等式

那么对于一个传递链(e1, r, e2), …, (em-1, r, em)。都须满足

这表示一个实体表示经过多次的转换等价于对其进行一次转换。由此作者试图用投影的方式建模关系的传递模式。并定义第k维的投影矩阵  .

da755acade5af89b10bb798842e627e1.png

其中

1a52f10de476df9ca30602faebafe045.png

于是第k维分量在旋转后的新坐标下的投影为

9488e9e53ca40b79e966aec1f4d5fc2d.png

这表示在传递链上的实体e1, …, em。模型只要求它们的表示在投影矩阵  下相同,原来的表示可以不同。Rot-Pro的打分函数为:

fa44d6d9978fe7e786ec2bcfea80c678.png

6b32f96b19099b0a4c8dc3d375427c00.png

并使用联合损失L进行训练,其中Lw为自对抗的负采样损失,Lp为对投影矩阵的正则化项。

720d38d0b023042d04b2a135a7762ab4.png

3fe9350fa3dfd7d32afd011833cf5bf8.png

655e54b50d34a32ea3e8fdbd78d9faec.png

理论证明

对于每个三元组(h, r, t),Rot-Pro模型要求

a552ad2066781c78f404d8521887581d.png

于是

72f9486e6b75940edd3b316b81919f45.png

上式要想成立当且仅当

ed1863270a106e736fc136e3bd264916.png

此式表明对于在传递链路上的所有实体,都会在复数空间中被投影到同一条直线上,即

dfd1f68bd6eaeb76b60bf976ef5878ad.png

其中  是一个常数,形象化表达如下图。

7fa40a6ab9d55850aa3286a62ac0ec85.png

实验结果

作者在4个数据集上进行了实验。表3表示Rot-Pro在大部分指标上要好于baseline,与RotatE模型效果差异不大的原因在于FB15K237和WN18RR两个数据集没有充足的传递性的关系。表4表示在YAGO3-10和Countries两个含有传递性关系的数据集上,模型相较RotatE有了更明显的提升。

4829088fc1bfb47dbf516b450b883c1a.png

0e88c132057ac9df7ee73401b20bdcc6.png

总结

论文理论证明了传递性的关系可以使用投影变换来建模,并提出了模型Rot-Pro同时使用旋转和投影变换,从而可以有效推理对称,非对称,逆向,组成,以及传递这些关系模式。并且论文在4个数据集上进行了实验,以此证明该模型可以有效地建模具有传递模式的关系。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

1665083a656ae6389099cd3195a05413.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477758.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

隐马尔科夫模型(HMM)笔记(公式+代码)

文章目录1. 基本概念1.1 HMM模型定义1.2 盒子和球模型1.3 观测序列生成过程1.4 HMM模型3个基本问题2. 概率计算问题2.1 直接计算法2.2 前向算法2.2.1 前向公式证明2.2.2 盒子和球例子2.2.3 前向算法Python代码2.3 后向算法2.3.1 后向公式证明2.3.2 后向算法Python代码2.4 一些概…

Spring Cloud Alibaba基础教程:Sentinel Dashboard中修改规则同步到Apollo

在之前的两篇教程中我们分别介绍了如何将Sentinel的限流规则存储到Nacos和Apollo中。同时,在文末的思考中,我都指出了这两套整合方案都存在一个不足之处:不论采用什么配置中心,限流规则都只能通过Nacos界面或Apollo界面来完成修改…

中科院科研人员自白:我为什么离开北京

文 | 榴莲EDU源 | 知乎北大本硕博毕业,毕业到中科院北京某所。今年是我工作第三年,年前刚刚调动了工作,转战南京某高校。为什么?细说起来一大堆,总结起来就两个字:房子。上学的时候不了解墙外的世界&#x…

评测通知 | 2022年全国知识图谱与语义计算大会评测任务发布

一、任务简介CCKS技术评测旨在为研究人员提供测试知识图谱与语义计算技术、算法、及系统的平台和资源,促进国内知识图谱领域的技术发展,以及学术成果与产业需求的融合和对接。去年,CCKS 2021评测竞赛环节共设立了5个主题共计14个任务&#xf…

LeetCode 38. 报数

1. 题目 报数序列是一个整数序列,按照其中的整数的顺序进行报数,得到下一个数。其前五项如下: 1 11 21 1211 111221 1 被读作 "one 1" ("一个一") , 即 11。 11 被读作 "two 1s" ("两个一"&…

Spring Cloud Alibaba基础教程版本升级:0.2.1-gt;0.2.2

最近Spring Cloud Alibaba发布了最新版本,其中包含了一些比较重要的内容,比如:Nacos 1.0.0支持,Dubbo的支持等。所以把之前的系列文章中内容以及代码案例都做了升级,其中包括: Spring Cloud Alibaba 从 0.…

Google掀桌了,GLUE基准的时代终于过去了?

文 | Severus大家好,我是Severus,一个在某厂做中文文本理解的老程序员。今年11月,Google 在 NeurIPS2021 投稿了一篇文章,名为 AI and the Everything in the Whole Wide World Benchmark,矛头直指评估AI模型“通用”能…

技术动态 | W3C计划成立RDF-star工作组

转载公众号 | W3C资讯W3C 计划成立 RDF-star 工作组,现开始筹备小组工作章程,界定标准化范畴及工作模式。详情参见以下章程草案:https://w3c.github.io/rdf-star-wg-charter/RDF-star(最初拼写为 RDF*)是 RDF 的一种扩…

LeetCode 1282. 用户分组(桶排序思想)

1. 题目 有 n 位用户参加活动,他们的 ID 从 0 到 n - 1,每位用户都 恰好 属于某一用户组。给你一个长度为 n 的数组 groupSizes,其中包含每位用户所处的用户组的大小,请你返回用户分组情况(存在的用户组以及每个组中用…

Spring Cloud Alibaba 新版本发布:众多期待内容整合打包加入!

在Nacos 1.0.0 Release之后,Spring Cloud Alibaba也终于发布了最新的版本。该版本距离上一次发布,过去了整整4个月!下面就随我一起看看,这个大家期待已久的版本都有哪些内容值得我们关注。 版本变化 之前在《Spring Cloud Aliba…

MSRA-万字综述 直击多模态文档理解

文 | 付奶茶随着最近几年多模态大火的,越来越多的任务都被推陈出新为多模态版本。譬如,传统对话任务,推出了考虑视觉信息的多模态数据集;事件抽取,也推出视频形式的多模态版本;就连 grammar induction&…

LeetCode 991. 坏了的计算器(逆向思考)

1. 题目 在显示着数字的坏计算器上,我们可以执行以下两种操作: 双倍(Double):将显示屏上的数字乘 2;递减(Decrement):将显示屏上的数字减 1 。 最初,计算器…

Spring Cloud Alibaba基础教程:Sentinel使用Apollo存储规则

上一篇我们介绍了如何通过Nacos的配置功能来存储限流规则。Apollo是国内用户非常多的配置中心,所以,今天我们继续说说Spring Cloud Alibaba Sentinel中如何将流控规则存储在Apollo中。 使用Apollo存储限流规则 Sentinel自身就支持了多种不同的数据源来…

评测 | CCKS2022-面向数字商务的知识图谱比赛重磅上线,奖金等你来拿!

转载公众号 | 夕小瑶的卖萌屋CCKS 2022面向数字商务的知识图谱评测赛题介绍阿里巴巴商品数据规模庞大,商品知识图谱为海量异构的商品数据的组织、管理和利用提供了有效的方式。商品数据模态丰富,动态性高,数据存在噪声,这些都对商…

安利几个优质NLP开源项目!搜索、问答、情感分析…

自然语言处理技术在各行业有着广泛的应用,然而长久以来,其落地并不是一帆风顺的。针对这些棘手的问题,百度飞桨深耕产业界,选取NLP领域三大高频场景——检索、问答、情感分析,推出面向真实应用场景的系统功能&#xff…

Spring Cloud Alibaba基础教程:Sentinel使用Nacos存储规则

通过上一篇《使用Sentinel实现接口限流》的介绍,相信大家对Sentinel已经有了初步的认识。在Spring Cloud Alibaba的整合封装之下,接口限流这件事情可以非常轻易的整合到我们的Spring Cloud应用中。但是,通过上篇的整合,依然还不能…

LeetCode 539. 最小时间差(哈希)

1. 题目 给定一个 24 小时制(小时:分钟)的时间列表,找出列表中任意两个时间的最小时间差并已分钟数表示。 示例 1: 输入: ["23:59","00:00"] 输出: 1备注: 列表中时间数在 2~20000 之间。 每个时间取值在 0…

论文浅尝 | Seq2Seq 知识图谱补全与问答

笔记整理:李行,天津大学硕士论文题目:Sequence-to-Sequence Knowledge Graph Completion and Question Answering链接:https://arxiv.org/pdf/2203.10321.pdf动机知识图嵌入 (KGE) 模型用低维嵌入向量表示知识图 (KG) 的每个实体和…

刀功:谈推荐系统特征工程中的几个高级技巧

前言记得我入算法这一行的第一份工作面试的时候,最终的boss面的面试官是前微软工程院的副院长。面试进行得很顺利,不免向前院长卖弄一番,谈了谈我对算法的理解。我说算法工程师就好比厨师,模型是灶上功夫,而数据预处理…

Spring Cloud Alibaba基础教程:使用Sentinel实现接口限流

最近管点闲事浪费了不少时间,感谢网友libinwalan的留言提醒。及时纠正路线,继续跟大家一起学习Spring Cloud Alibaba。 Nacos作为注册中心和配置中心的基础教程,到这里先告一段落,后续与其他结合的内容等讲到的时候再一起拿出来说…