论文浅尝 | Convolutional 2D knowledge graph embedding

笔记整理 | 孙悦,天津大学


1. 介绍:

知识图的链接预测是预测实体之间缺失关系的任务。先前有关链接预测的工作集中在浅,快速的模型上,这些模型可以缩放到大型知识图例如基于基于平移变换的 TransE 系列。但是,这些模型比深层次的多层模型学习的表达功能要少,这可能会限制性能。本文中提出了一种多层卷积网络模型ConvE(用于链路预测)。该模型在建模具有高度关联性的节点时非常有效,而高度关联的复杂知识图(例如Freebase和YAGO3)非常常见。

2.背景:

知识图谱中的链接预测模型通常由简单的操作组成,例如内积和嵌入空间上的矩阵乘法,并使用数量有限的参数,其特征在于嵌入参数之间的三向交互,每个参数产生一个特征。使用这种简单,快速,浅层的模型可以使人们按比例缩放到较大的知识图,而代价是学习较少的表达特征导致最终连接预测的效果堪忧。

增加浅层模型中特征的数量(从而提高其表达能力)的唯一方法是增加嵌入大小。但是,这样做导致无法缩放到较大的知识图,因为嵌入参数的总数与图中实体和关系的数量成比例。解决浅层架构的缩放问题以及完全连接的深层架构的过拟合问题的一种方法是使用参数有效的快速运算符,该运算符可以组成深层网络。基于此作者想到了卷积操作

通常在计算机视觉中使用的卷积运算符具有这些特性:由于高度优化的GPU实现,它具有高效的参数和快速的计算能力。此外,由于其无处不在的使用,在训练多层卷积网络时已经建立了鲁棒的方法来控制过度拟合。

在本文中提出了ConvE,该模型在嵌入上使用2D卷积来预测知识图中的缺失链接。ConvE 是用于链接预测的最简单的多层卷积体系结构:它由单个卷积层,嵌入尺寸的投影层和内部乘积层定义。

文章的贡献如下:本文的贡献如下:

1)引入了一个简单的,竞争性的2D卷积链接预测模型ConvE。

2)开发了一个1-N 的评分过程,将训练速度提高三倍,并将评估速度提高300倍。

3)确定本文的模型具有很高的参数效率,在参数减少8倍和17倍的情况下,在FB15k-237上比DistMult和R-GCN得分更高。

4)表明对于以indegree和PageRank衡量的日益复杂的知识图,本文的模型与浅层模型之间的性能差异与图的复杂度成比例地增加。

5)系统研究跨常用链接预测数据集报告的逆关系测试集泄漏,并在必要时引入可靠的数据集版本,以便使用简单的基于规则的模型无法解决它们。

对于给出一个三元组,再利用模型对他们的表示进行嵌入后的评分函数,本文给出了一个总结

3.Convolutional 2D Knowledge Graphs Embeddings

模型架构如下所示:

训练过程:首先,先通过预训练方法得到头节点和关系的初始表示。按照把这两个一维向量reshape成二维,再通过若干个卷机核,得到相应的feature map。将这些feature map展开成一维向量,再通过一个全连接层获得到我们最终的关于这个头节点和关系的嵌入表示。最后和所有entity表示构成的entity matrix相乘,得到对应于每一个尾节点的得分。加上一个sigmoid层即得到预测分数。scoring function为

训练过程中,使用logistic sigmoid function来计算评分,之后最小化二分类损失函数:

快速评估:与其他将实体对和关系作为三元组(s,r,o)并对其进行评分(1-1评分)不同。可以看到这个模型一次性和多个尾节点比较,可以得出多个三元组的评分(1-N得分)。因此该方法适用于大型知识图谱。

4.实验:

1)参数有效性:

2)模型表现:

3)测试集中逆关系的泄露问题:

为了系统研究此问题的严重性,本文构建了一个简单的基于规则的模型,该模型仅对逆关系建模,称之为逆模型。该模型自动从训练集中提取逆关系:给定两个关系对r1,r2∈R,我们检查(s,r1,o)是否隐含(o,r2,s),反之亦然。

在测试时,我们检查三元组是否在测试集之外具有逆匹配项:如果找到了k个匹配项,则对这些匹配项的前k个排名进行排列;如果找不到匹配项,则为测试三元组选择一个随机排名。

如上表3,4,逆模型在FB15k和WN18的许多不同指标上都达到了最新水平。但是,它未能适应YAGO3-10和FB15k-237的逆关系。但在去除了逆关系的数据集上,表现就很差了。

4)消融分析:

   

5)为什么在WN18RR数据集上的表现欠佳

本文提出的方法在YAGO3-10和FB15k-237等数据集上与WN18RR相比具有良好的性能。作者发现使发现WN18RR和其它数据集相比其结点入度要小很多,认为表示如此高入度的节点需要捕获所有入度边关联结点之间的差异,作者假设更深层的模型(即学习多层特征的模型(例如ConvE))比浅层模型(例如DistMult)在捕获所有这些约束方面具有优势。但是,更深的模型更难以优化,因此我们假设,对于平均关系特定度数较低的数据集(例如WN18RR和WN18),像DistMult这样的浅层模型可能足以准确表示网络的结构。具体的,用使用pagerank(原来用于度量网页的重要性,这里用来度量每个节点的重要性)。对这几个数据集分析,可以看到DistMult和ConvE之间在Hits@10方面的性能差异与平均测试集PageRank大致成比例,即平均PageRank越高与DistMult相比,测试集节点中的ConvE效果更好,反之亦然。

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478464.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

sysbench在美团点评中的应用

如何快速入门数据库?以我个人经验来看,数据库功能和性能测试是一条不错的捷径。当然从公司层面,数据库测试还有更多实用的功能。这方面,美团点评使用的是知名工具sysbench,主要是用来解决以下几个问题: 统一…

常见中文NER数据集大盘点

常见中文NER数据集大盘点 https://zhuanlan.zhihu.com/p/164966421

[中文事件抽取]DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Lab

[中文事件抽取]DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Lab: ACL 2018DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Labeled Training DataAuthorHang Yang, Yu…

论文浅尝 - ACL2020 | 通过集成知识转换进行多语言知识图谱补全

笔记整理 | 谭亦鸣,东南大学博士生概述预测图谱中缺失的事实(fact)是知识图谱构建与推理中的一个重要任务,近年来也被许多KG embedding研究的关注对象。虽然目前的KG embedding方法主要学习和预测的是单个图谱中的事实,但是考虑到KG之间不同规…

LsLoader——通用移动端Web App离线化方案

由于JavaScript(以下简称JS)语言的特性,前端作用域拆分一直是前端开发中的首要关卡。从简单的全局变量分配,到RequireJS实现的AMD模块方式,browserify/webpack实现的静态引用方式。前端的业务逻辑也从一个个精心按顺序…

ACL'21 | debug完的神经网络,如何测试是否仍然存在bug?

文 | Sherry回归测试熟悉软件工程的小伙伴们一定知道回归测试:修改了旧代码后,重新进行测试以确认修改没有引入新的错误或导致其他代码产生错误。它可以大幅降低系统测试、维护升级等阶段的成本。随着深度学习网络的不断发展,越来越多的系统都…

LeetCode 198. 打家劫舍(DP)

1. 题目 你是一个专业的小偷,计划偷窃沿街的房屋。每间房内都藏有一定的现金,影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统,如果两间相邻的房屋在同一晚上被小偷闯入,系统会自动报警。 给定一个代表每个房屋存…

Python快速找到列表中所有重复的元素

Python快速找到列表中所有重复的元素:https://blog.csdn.net/sinat_29957455/article/details/103886088 index方法 为了能够找到元素在列表中的位置,我们通常会使用list.index()方法来元素的下标,但是这种方法有一个弊端,就是当列…

论文浅尝 - ACL2020 | 利用常识知识图对会话流进行显式建模

笔记整理 | 韩振峰,天津大学硕士链接:https://arxiv.org/pdf/1911.02707.pdf动机人类对话自然地围绕相关概念发展,并分散到多跳概念。本文提出了一种新的会话生成模型——概念流(ConceptFlow),它利用常识知识图对会话流进行显式建…

百度NLP、视频搜索团队招聘算法实习生!

致力于连接最靠谱的算法岗与最强的求职者招聘贴投放请联系微信xixiaoyao-1问答工作职责研发文本问答、多模态问答、阅读理解、端到端问答等技术,利用NLP理论和方法解决实际问题结合数据、算力优势,在百度的搜索、凤巢等产品和业务实现技术落地研究问答、…

人工智能在线特征系统中的数据存取技术

主流互联网产品中,不论是经典的计算广告、搜索、推荐,还是垂直领域的路径规划、司机派单、物料智能设计,建立在人工智能技术之上的策略系统已经深入到了产品功能的方方面面。相应的,每一个策略系统都离不开大量的在线特征&#xf…

将二维列表输出到excel

list1 [[张三,男,未婚,20],[李四,男,已婚,28],[小红,女,未婚,18],[小芳,女,已婚,25]] output open(data.txt,w,encodinggbk) output.write(name,gender,status,age\n) for row in list1:rowtxt {},{},{},{}.format(row[0],row[1],row[2],row[3])output.write(rowtxt)output.…

论文浅尝 - ACL2020 | IntKB: 一种交互式知识图谱补全框架

笔记整理 | 谭亦鸣,东南大学博士来源: ACL 2020链接:https://www.aclweb.org/anthology/2020.coling-main.490.pdf资源:https://github.com/bernhard2202/intkb.概述知识库作为许多下游NLP任务的资源基础,存在的一个普遍缺陷是它…

预训练模型的前世今生(有福利!)

近年来,在深度学习和大数据的支撑下,自然语言处理技术迅猛发展。而预训练语言模型把自然语言处理带入了一个新的阶段,也得到了工业界的广泛关注。通过大数据预训练加小数据微调,自然语言处理任务的解决,无须再依赖大量…

LeetCode 337. 打家劫舍 III(记忆化+递归)

文章目录1. 题目1.1 相关题目:2. 解题2.1 递归2.2 记忆化递归1. 题目 在上次打劫完一条街道之后和一圈房屋后,小偷又发现了一个新的可行窃的地区。这个地区只有一个入口,我们称之为“根”。 除了“根”之外,每栋房子有且只有一个…

孵化业务快速落地与优化

海外酒店是酒旅事业群第一个孵化的业务,从2016年9月份开始到现在已经半年多的时间。在业务后台搭建、成长、优化过程中,经历了很多的思考与选择。 主要分为下面几个阶段: 初建:调研、落地,合理复用,高效自建…

TPLinker 联合抽取 实体链接方式+源码分析

关系抽取–TPLinker: https://blog.csdn.net/weixin_42223207/article/details/116425447 Tagging TPLinker模型需要对关系三元组(subject, relation, object)进行手动Tagging,过程分为三部分: (1)entity head to enti…

论文浅尝 | KGAT: 用于推荐的知识图注意力网络

笔记整理 | 李爽,天津大学链接:https://arxiv.org/pdf/1905.07854v1.pdf动机为了提供更准确、多样化和可解释的推荐,必须超越对用户-项目交互的建模,并考虑辅助信息。传统的方法,如因子分解机(FM),将其视为…

对话系统答非所问?快试试这篇ACL'21的连贯性评估大法

文 | 页眉3编 | 小轶背景当我们在绞尽脑汁地想怎么设计一个对话系统的时候,我们当然希望最后训练出来的系统能越像人越好,输出的回复很连贯,很有趣,很体贴。而其中,连贯性可以说是最基本的要求之一了,毕竟不…

LeetCode 384. 打乱数组(rand)

1. 题目 打乱一个没有重复元素的数组。 示例:// 以数字集合 1, 2 和 3 初始化数组。 int[] nums {1,2,3}; Solution solution new Solution(nums);// 打乱数组 [1,2,3] 并返回结果。任何 [1,2,3]的排列返回的概率应该相同。 solution.shuffle();// 重设数组到它的初始状态[…