论文解读-《Less is More on the Over-Globalizing Problem in Graph Transformers》 - zhang

news/2025/9/27 21:57:47/文章来源:https://www.cnblogs.com/zhang-yd/p/19115771

1. 论文介绍

论文题目:Less is More on the Over-Globalizing Problem in Graph Transformers
论文领域:图神经网络,graph transformer
论文发表: ICML 2024
论文代码:https://github.com/null-xyj/CoBFormer
论文背景:

gnntranformercobformer01

2. 论文摘要

图变换器(graphtransformer)由于其全局注意机制,成为处理图结构数据的新工具。在全连通图中,全局注意机制考虑了一个更宽的感受域,这使得许多人相信可以从所有节点中提取有用的信息。在本文中,我们挑战这个信念:是否全球化的性质总是有益于图变压器?本文通过实证和理论分析揭示了图变换中的过度全球化问题,即当前的注意机制过分关注那些距离较远的节点,而包含大部分有用信息的距离较近的节点相对较弱。然后提出了一种新的具有协同训练的双层全局图变换器(CoBFormer),该变换器包括簇间变换器和簇内变换器,在保持从远程节点提取有价值信息的能力的同时,避免了过度全球化问题。同时,提出了协同训练的方法,为提高模型的泛化能力提供了理论保证。在各种图上的大量实验很好地验证了我们提出的协同变换器的有效性。

3. 相关介绍

3.1 背景介绍

GNN的缺点:因为其堆叠会导致过度平滑和过度挤压的问题,他们的关注力是在邻居
transformer是: 因为其全局注意力机制,表现出了卓越的表达能力。

给出本文的核心研究问题:针对Graph Transformer架构的全局注意力是否总是有效的。
全局的注意力架构可表述为

gnntranformercobformer02

结论:
从实证上发现,所有节点对的学习注意力分数分布与实际信息节点的分布之间存在不一致,即全局注意力机制倾向于关注高阶节点,而有用信息往往出现在低阶节点上。
尽管高阶节点可能会提供额外的信息,但当前的注意力机制过于关注这些节点。从理论上讲,我们证明了过度扩展的感受野会降低全局注意力机制的有效性,进一步暗示了过度全局化问题的存在。

针对全局注意力在图上的缺陷的问题,
如何改进当前的全局注意力机制,防止 Graph Transformers 中过度全局化的问题,同时仍然保持从高阶节点提取有价值信息的能力?
已有的研究的方法:可以通过隐式或显式集成本地模块(例如 GNN)来补充图转换器来缓解这个问题。

3.2 过度全局化问题

仔细研究注意力分数的分布,以研究注意力机制捕获的信息。
定义了与节点共享相同标签的第 k 跳邻居的比例为

gnntranformercobformer03

将分配给第 k 跳邻居的平均注意力分数表示为 Attn- k,定义为

gnntranformercobformer04

在数据Cora,Actor等数据集上的值随着k跳变化的变化,分析了不同跳数的邻居对应的C值

gnntranformercobformer05

3.3 论文贡献

(1)首先展示了一个关键现象:Graph Transformer通常会产生节点分类注意力机制的过度全局化问题。理论分析和实证证据都表明,这个问题将从根本上影响Graph Transformer。我们的发现提供了一个视角,为图转换器的改进提供了宝贵的见解。
(2)提出了 CoBFormer,一个具有协作训练的双级全局图转换器,它有效地解决了过度全局化的问题。理论分析表明,我们提出的协同训练将提高模型的泛化能力。
(3)大量实验表明,CoBFormer 的性能优于最先进的图转换器,并有效解决了过度全局化问题。

4. CoBFormer

CoBFormer算法的整个算法框架为

gnntranformercobformer06

大概步骤:
(1)首先使用 METIS 算法将图划分为不同的聚类。
(2)提出了双级全局注意力(BGA)模块,该模块由集群内 Transformer 和集群间 Transformer 组成。该模块通过解耦集群内和集群间的信息,有效地缓解了过度全局化问题,同时保持了全局的接受能力。为了捕获 BGA 模块忽略的图结构信息,采用图卷积网络(GCN)作为局部模块。
(3)提出了协同训练,以整合 GCN 和 BGA 模块所学到的信息,提高其性能。

4.1 双级全局注意力模块

聚类类内部的tranformer架构为

gnntranformercobformer07

聚类类间的tranformer架构为

gnntranformercobformer08

$𝐇_p^k$ 对于 和 $𝐏^k$ ,我们将节点表示与其相应的聚类表示连接起来,并 $𝐇_p^{k+1}$ 使用参数化为以下的 $𝐖_f$ 融合线性层计算输出节点表示:

gnntranformercobformer09

4.2 协同训练

使用两个线性层 Lin-G 和 Lin-T 将 GCN 和 BGA 模块的输出映射到标签空间
gnntranformercobformer10

使用 SoftMax 函数来计算预测标签和软标签

gnntranformercobformer11

5. 实验设置

数据集采用同质图数据集有 Cora,CiteSeer,PubMed,Ogbn-Arxiv,Ogbn-Products。
异质图数据集有:Actor,Deezer。

对比基线:
两个经典的GNN:GCN和GATE
三个最先进的graph Tranformer:NodeFormer,NAGphormer,BGA算法

节点分类实验数据,评价标准采用Micro-F1和Macro-F1作为评价指标

gnntranformercobformer12

实验结论:
(1)CoBFormer 的 GCN 和 BGA 模块在同质图中都大幅优于所有基线,证明了 CoBFormer 的有效性。
(2)在异质图中,我们的 BGA 模块的性能可与最佳基线 SGFormer 相媲美,甚至超过。这表明我们的 BGA 模块可以成功捕获全局信息。
(3)与 GCN 和 GAT 相比,传统图转换器在异质图上表现出优异的性能。

消融实验
以评估 CoBFormer 的两个基本组件:BGA 模块和协作训练方法

gnntranformercobformer13

(1) 无论是否使用协作训练,我们的 BGA 模块的准确性在所有数据集上的准确性始终优于普通的全球关注度,这证明了我们 BGA 模块的有效性。
(2)协同训练导致 GCN 和 BGA 模块的精度显著提高,表明它通过鼓励互学习增强了模型的泛化能力。
(3)BGA 模块大幅减少 GPU 内存,解决可扩展性问题。

解决过度全局化的能力
gnntranformercobformer14

6. 总结

CoBFormer算法的创新点有两个,一个是METIS聚类,一个协同训练。同时在局部和全局进行transformer操作,有点bagging的意思。

7. 个人感悟

个人看起来注意力架构在graph tranformer领域中优化的已经挺深入了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/919993.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

发布软文网站济南建设工程交易中心

在互联网的世界中,不同应用程序的数据传输方法各异。P2P文件共享(Peer-to-Peer File Sharing) 作为一种高效的文件传输方式,使得用户可以在没有中央服务器的情况下直接进行文件交换。本文将详细介绍P2P文件共享的基本原理、优势及…

网站规范建设学校网站集群建设

该文章专注于面试,面试只要回答关键点即可,不需要对框架有非常深入的回答,如果你想应付面试,是足够了,抓住关键点 面试官:Hash索引和B+树区别是什么?在设计索引怎么选择? 在MySQL中,Hash索引和B+树索引是两种常见的索引类型,他们有以下区别: 数据结构:Hash索引:…

loguru 日志库快速入门

1.loguru 1.1 loguru 介绍loguru是一个功能强大且非常容易使用的第三方开源Python日志管理库。它建立在Python标准库中的logging模块之上,并提供了更加简洁直观、功能丰富的接口。github仓库地址:https://github.com…

MATLAB工具箱

MATLAB工具箱一、一维离散数据微分、积分求解 1. 离散积分 function result = integral(x,y,c)result = [];for i=1:1:length(y)c=y(i)*(x(2)-x(1))+c ; result(end+1) = c;end end2. 离散微分 function result = diff…

内存访问流程

*假设执行 int a=0x1234(分配一块逻辑地址,0x56789999)32位系统 *CPU会将逻辑地址拆分为两部分 V=56789() 页内偏移=0x999 *由MMU使用0x56789变量,查进程表找到值为0xabcde *拼接物理地址:0xabcde 999 *有内存…

网站推广洛阳wordpress插件中文版下载

C# 中的字符串类型(string)是不可变的,这意味着一旦创建了一个字符串对象,就不能再对其进行修改。 当对一个字符串进行拼接、替换、删除等操作时,实际上是创建了一个新的字符串对象,而原始的字符串对象保持…

.NET操作Word实现智能文档处理 - 内容查找替换与书签操作

如何在Word大量文档中查找并替换特定内容?如何在文档的特定位置自动插入动态内容?如何创建能够自动生成报告的智能文档系统?本文介绍的查找替换和书签操作技术,将能够轻松实现这些功能,大大提高文档处理的效率和准…

day19_添加 修改

day19_添加 修改 1添加场景分析1使用弹出框 承载添加界面 2弹出框输入菜单信息 提交到添加接口 3添加接口处理完毕 反馈信息 弹窗处理结果 关闭弹出框 刷新table数据 2sql分析 -- 逻辑主键 一般不加自增 由使用人员维…

day18_查询功能 合并servlet

day18_查询功能 合并servlet 1.sql分析 -- 分页+条件 查询 select am1.*,IFNULL(am2.menuname,无) as pname from admin_menu am1 left join admin_menu am2 on am1.pid = am2.mid-- 动态查询条件 where am1.menuna…

NOIP模拟赛 十七

倍增+DP+DP+可持久化平衡树A. 对于一个 \(x\) ,如果 \(x\bmod a < x\) ,称其为有效的。我们断言,有效次取模只会发生 \(\log\) 次。 如果发生有效取模,则 \(a<x\) 。\(a\le \frac{x}{2}\) 则 \(x\bmod a <…

day22_用户模块

day22_用户模块 1查询sql分析 -- 定制系统 -- 查询分段记录 select au1.*,au2.username create_uname from admin_user au1 left join admin_user au2 on au1.create_uid = au2.uidwhere au1.username like CONCAT(%,a…

做招聘网站多少钱网站找不到首页

一切从“/”开始 在Linux系统中&#xff0c;目录、字符设备、块设备、套接字、打印机等都被抽象成了文件&#xff0c;一切皆为件 与windows操作系统不同&#xff0c;Linux系统内不存在C/D/E/F盘等&#xff0c;一切文件都是从根&#xff08;/&#xff09;目录开始的 Linux系统…

常州网站建设要多少钱wordpress 全站ajax

随着物联网、大数据、人工智能等技术的快速发展&#xff0c;边缘计算已成为当前信息技术领域的一个热门话题。在物联网领域&#xff0c;边缘计算被广泛应用于智慧交通、智能安防、工业等多个领域。因此&#xff0c;基于边缘计算技术的工业主板设计方案也受到越来越多人的关注。…

2025 丹东店推荐:丽格门窗,用 20 年技术沉淀守护家的舒适

在四季分明、冬季严寒的丹东,门窗的隔热保温、密封抗风性能直接决定着家居生活的幸福感。2025 年装修选门窗,坐落于丹东市振兴区兴六路大昌建材隔壁的丽格门窗店,带来了专为北方气候定制的系统门窗解决方案,其深厚…

NOIP2025模拟赛23

T1 T2 T3 T4\(\color{#52C41A} 普及+/提高\) \(\color{#3498DB} 提高+/省选-\) \(\color{#52C41A} 普及+/提高\) \(\color{#9D3DCF} 省选/NOI-\)参赛网址:https://oj.33dai.cn/d/TYOI/contest/689d2670c5d9c2f14c2250…

step

action被输入到机器人的控制器之前,做一个预处理,做一个clip截断,乘以一个scale,做完之后,再apply到机器人,计算reward和done(超时或者terminate),有done就reset,apply interval event,最后计算观测。 acti…

2025 呼和浩特店推荐:丽格门窗,用 20 年技术沉淀守护家的温度

在呼和浩特寒冷漫长的冬季与多风的气候环境中,门窗的隔热保温、抗风压性能直接决定着居住的舒适度与能耗成本。2025 年装修选门窗,位于呼和浩特市新城区欧亚达家具一楼的丽格门窗,凭借二十余年系统门窗专业积淀与针…

深入解析:浏览器端音视频处理新选择:Mediabunny 让 Web 媒体开发飞起来

深入解析:浏览器端音视频处理新选择:Mediabunny 让 Web 媒体开发飞起来pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family:…

2025 宁波门窗店推荐:丽格门窗,甬城品质家居的安心之选

在宁波四季分明且湿润多雨的气候下,门窗的隔热、防水、隔音性能直接决定居家舒适度。2025 年装修或换窗,位于宁波市鄞州区宁穿路 988 号筑入空间 2 楼北侧的丽格门窗,凭借 20 余年系统门窗专业积淀与针对性产品设计…

移动硬盘上的文件消失了?以下是Mac电脑解除方法

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …