论文浅尝 – KDD2020 | 使用图对比编码的图神经网络预训练模型

论文笔记整理:陈名杨,浙江大学在读博士生,研究方向为知识图谱表示学习。


图表示学习是一个当前关注度较高的领域,并且有许多真实的应用。然而当前的很多图表示学习方法都是对一个领域或者某一个图训练一个模型,也就是说这些训练的模型是不能迁移到领域外新的数据。这篇文章受到在NLP领域预训练工作的启发,设计了一种无监督的图对比编码(Graph Contrastive Coding,GCC)模型,来捕获不同图之间的全局拓扑特征。这里将GCC的预训练任务设计为区分不同图内不同点的局部子图结构,并且利用对比学习(Contrastive Learning)来学习到一些固有的、可迁移的结构表示。

这里提出的GGC的整体思想是,在预训练阶段,给一些不同的图,然后在上面做一些自监督学习,预训练得到一个表示学习的模型,然后把这个模型用在一些更多没有见过的的图上对不同的任务进行微调,下面将对具体的方法及模型的设计进行介绍。

这里预训练的任务是instance discrimination,也就是将每个节点看作是一个自己的类,然后区分不同节点作为学习目标。从对比学习的视角来看待,给定一个被编码的query q,以及一个包含K个keys的字典,对比学习是要在dictionary里面找一个和query最匹配的key认为是和query同类的实例,在这篇文章中使用的InfoNCE作为学习目标,

除了这个整体的学习目标外还需要考虑下面一些问题。

1. 如何设计图中的实例?

既然使用对比学习作为整个方法的总体目标,这里需要设计对比的实例,在本篇文章中,作者使用图中节点的r-ego network作为这个节点的实例表示,这r-ego network就是以某一个点为中心,其他点和这个点的最短距离小于r的点的集合的sub-graph。

2. 如何设计实例间的相似和不相似?

在计算机视觉中,有多种的数据增强方式。在本篇文章的场景中,把对于同一个点的两个采样结果不同的r-ego network作为相似的实例,而把不同点的采样作为不相似实例。

3. 如何设计图的编码方式?

这里使用一种当前SOTA的GNN方法Graph Isomorphism Network(GIN)作为对图的encoder方法。

整体方法的流程图如下所示:

实验部分,该模型在不同的图上进行与训练,其中与训练所使用的数据集如下,

在下游任务的实验中,尝试了不同对比学习策略(E2E,MoCo)以及不同的微调策略,实验结果如下,

       这篇文章提出的基于对比学习的图预训练模型可以有效的建模和迁移图中的结构特征从而达到预训练的目的,对比其他的从头开始学习的监督学习模型,该模型也可以获得相当的测试表现。

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478916.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 575. 分糖果(set集合去重)

1. 题目 给定一个偶数长度的数组,其中不同的数字代表着不同种类的糖果,每一个数字代表一个糖果。你需要把这些糖果平均分给一个弟弟和一个妹妹。返回妹妹可以获得的最大糖果的种类数。 输入: candies [1,1,2,2,3,3] 输出: 3 解析: 一共有三种种类的糖…

Android官方开发文档Training系列课程中文版:键盘输入处理之指定输入的类型

原文地址:http://android.xsoftlab.net/training/keyboard-input/index.html 引言 在文本框接收到焦点时,Android系统会在屏幕上显示一个软键盘。为了提供良好的用户体验,你可以指定相关输入类型的特性,以及输入法应当如何展现。…

美团 R 语言数据运营实战

一、引言 近年来,随着分布式数据处理技术的不断革新,Hive、Spark、Kylin、Impala、Presto 等工具不断推陈出新,对大数据集合的计算和存储成为现实,数据仓库/商业分析部门日益成为各类企业和机构的标配。在这种背景下,是…

Android官方开发文档Training系列课程中文版:键盘输入处理之控制输入法的显示方式

原文地址:http://android.xsoftlab.net/training/keyboard-input/visibility.html 当输入的焦点进入或者离开文本框时,Android会适时的显示或隐藏输入法。系统还会决定UI及文本框如何出现在输入法的上方。比如,当垂直方向上的可用空间非常紧…

python用schedule模块实现定时任务

python用schedule模块实现定时任务 import schedule import timedef test():print("Im working...") def test2(): print("Im working... in job2")# 每10分钟执行一次job函数 schedule.every(10).minutes.do(test) # 每10秒执行一次job函数 schedule.…

天天说常识推理,究竟常识是什么?

文 | 花小花Posy写这篇文章的时候,我去搜了搜常识的例子。“睁开眼睛打喷嚏是不可能的。(还真没留意。)““北极熊是左撇子。“”长颈鹿没办法咳嗽。”呃?好吧,我需要补一补自己的常识。那么这些所谓的“常识”真的是常…

论文笔记 | Counterfactual Samples Synthesizing for Robust VQA

论文笔记整理:窦春柳,天津大学硕士。来源:CVPR 2020链接:https://openaccess.thecvf.com/content_CVPR_2020/papers/Chen_Counterfactual_Samples_Synthesizing_for_Robust_Visual_Question_Answering_CVPR_2020_paper.pdf动机当今…

Android消息总线的演进之路:用LiveDataBus替代RxBus、EventBus

背景 对于Android系统来说,消息传递是最基本的组件,每一个App内的不同页面,不同组件都在进行消息传递。消息传递既可以用于Android四大组件之间的通信,也可用于异步线程和主线程之间的通信。对于Android开发者来说,经常…

Android官方开发文档Training系列课程中文版:键盘输入处理之处理键盘按键

原文地址:http://android.xsoftlab.net/training/keyboard-input/commands.html 当用户将焦点给到可编辑文本的View时,例如EditText这种,并且该设备还拥有实体键盘,那么所有的输入都会被系统处理。然而,如果你希望可以…

MYSQL返回指定时间间隔函数DATE_SUB和TO_DAYS详解

现在北京时间:2021年1月25日 11点 select time,content from shsqsj where time > DATE_SUB(Now(),INTERVAL 2 DAY); 返回的数据是:2021年1月23日23日11点到现在时刻(2021年1月25日 11点 )的数据。更多请参考 DATE_SUB函数 现…

论文浅尝 - ICLR2020 | 知道什么、如何以及为什么:基于方面的情感分析的近乎完整的解决方案...

论文笔记整理:余海阳,浙江大学硕士,研究方向为知识图谱、自然语言处理。链接:https://arxiv.org/abs/1911.01616动机基于目标的情感分析或基于方面的情感分析(ABSA)是指在细粒度的层次上解决各种情感分析任…

全栈深度学习第5期: 神经网络调试技巧

一起追剧鸭简介Berkeley全栈深度学习追剧计划是由夕小瑶的卖萌屋发起的优质公开课打卡项目,通过微信群为同期追剧的小伙伴提供交流平台。关于该计划的详请见这里。Berkeley深度学习追剧群目前已有1000小伙伴加入,公众号后台回复口令 深度学习追剧 入群。…

LeetCode 22. 括号生成(回溯/DP)

文章目录1. 题目2. 解题2.1 暴力回溯2.2 DP1. 题目 给出 n 代表生成括号的对数,请你写出一个函数,使其能够生成所有可能的并且有效的括号组合。 例如,给出 n 3,生成结果为:["((()))","(()())",…

Android官方开发文档Training系列课程中文版:后台服务之IntentService的创建

原文地址:http://android.xsoftlab.net/training/run-background-service/index.html 引言 除非特别指定,否则所有的操作都是在UI线程中执行的。不过这会引起问题,因为长时间的耗时操作会妨碍UI线程的运行。这会惹恼用户,并可能会引起系统错…

美团服务体验平台对接业务数据的最佳实践-海盗中间件

背景 移动互联网时代,用户体验为王。美团服务体验平台希望能够帮助客户解决在选、购、用美团产品过程中遇到的各种问题,真正做到“以客户为中心”,为客户排忧解难。但服务体验平台内部只维护客户的客诉数据,为了精准地预判和更好地…

中文近义词工具包:Synonyms

Synonyms Chinese Synonyms for Natural Language Processing and Understanding. 更好的中文近义词:聊天机器人、智能问答工具包。 synonyms可以用于自然语言理解的很多任务:文本对齐,推荐算法,相似度计算,语义偏移…

惊了,掌握了这个炼丹技巧的我开始突飞猛进

文 | 夕小瑶从不拖稿的小夕今天在知乎上刷到一个问题:哈?一向求真务实、高逼格讨论的知乎画风怎么突然就不一样了。我以为回答区会有这张图:▲如来神掌结果竟然没有!知乎果然没有让我失望,还是一如既往的认真、严谨、有…

LeetCode 876. 链表的中间结点(快慢指针)

1. 题目 给定一个带有头结点 head 的非空单链表,返回链表的中间结点。 如果有两个中间结点,则返回第二个中间结点。 2. 解题 快慢指针法 class Solution { public:ListNode* middleNode(ListNode* head) {ListNode *fast head, *slow head;while(f…

Android官方开发文档Training系列课程中文版:后台服务之IntentService的使用

原文地址:http://android.xsoftlab.net/training/run-background-service/send-request.html 上节课我们学习了如何创建IntentService。这节课我们主要学习如何通过Intent使IntentService执行工作请求。Intent可以将任何数据交给IntentService处理。你可以在Activi…

技术动态 | 多模态知识图谱

本文转载自漆桂林老师的知乎专栏。原文链接:https://zhuanlan.zhihu.com/p/163278672作者:郑秋硕,漆桂林,王萌知识图谱技术已经被广泛用于处理结构化数据(采用本体D2R技术)和文本数据(采用文本信…