cs224w课程学习笔记-第2课

cs224w课程学习笔记-第2课 传统图学习

  • 前言
  • 一、节点任务
    • 1、任务背景
    • 2、特征节点度
    • 3、特征节点中心性
      • 3.1 特征向量中心性(Eigenvector Centrality)
      • 3.2 中介中心性(Betweenness Centrality)
      • 3.3 接近中心性(Closeness Centrality)
    • 4、特征聚类系数
    • 5.、 特征图钩子
  • 二、边任务
    • 1、任务背景
    • 2、基于距离的特征
    • 3、局部邻域重叠
    • 4、全局邻域重叠

前言

传统图学习的流程是通过手动提取节点,边与图的特征,然后给到传统的机器学习算法(如随机森林,SVM等)中进行预测.接下将具体阐述节点,边与图涉及到的一些特征,及其任务预测.

一、节点任务

1、任务背景

对节点做聚类任务,此时要对节点进行特征提取来表征网络中节点的结构和位置,其提取的常见特征如下:
▪ 节点度(Node degree)
▪ 节点中心性(Node centrality)
▪ 聚类系数(Clustering coefficient)
▪ 图构子(Graphlets)

2、特征节点度

以下图无向图为例,可以看到A点的度为1,因为它只与C点相连,二B点与C,D点相连,因此它的度是2.在该例子中,不同节点的连接均一视同仁为1,若不同连接点间的连接权重不一致,则其度为所连接的权重之和;若为有向图,则度分为出度(节点到其它节点的连接)与入度(其它节点到该节点的连接)的和.
在这里插入图片描述

3、特征节点中心性

考虑节点在图中的重要性,其常见计算方法有

3.1 特征向量中心性(Eigenvector Centrality)

衡量节点的重要性,不仅取决于节点本身的连接数量,还取决于其相连节点的中心性.取相邻矩阵最大特征值对应的特征向量为中心性向量.
在这里插入图片描述

3.2 中介中心性(Betweenness Centrality)

基于节点在最短路径上的作用,反映节点作为其他节点之间“桥梁”的重要性。
在这里插入图片描述

3.3 接近中心性(Closeness Centrality)

通过计算节点与图中其他节点之间的平均最短路径长度来衡量。接近中心性越高,节点越接近图中其它节点。
在这里插入图片描述

4、特征聚类系数

在这里插入图片描述
如下图所示,求v的聚类系数,第一个图,每个邻居间相连的边数均为3,分子为12,节点度为4,分母为12,因此为1;第2个图边数为6,因此为0.,第3个图边数为0,因此为0.
在这里插入图片描述
注意的是该特征可以由图钩子特征计算得到

5.、 特征图钩子

Graphlets 通过找到每个节点的局部邻域中的小型子图模式,能够捕获细粒度的拓扑关系,
其到5个节点的子图模式一共有73中不一样的,通不同节点数,不子图模式我们可以统计出不同的特征.
在这里插入图片描述

  • 基于 Graphlets 的节点计数特征:
    对于每个节点,统计它在所有可能的 Graphlets 模式中出现的次数。例如:
    一个节点是否在三角形结构中。
    一个节点是否是路径的中间点。
    一个节点是否与某个四节点的星型结构(star)有关。
    这些计数可以形成一个特征向量,表示节点在局部邻域中所参与的不同 Graphlets 模式。

  • 基于角色的节点特征:
    Graphlets 中的每个节点可以具有不同的角色。例如:
    在三角形中,一个节点可能是“边三角形的顶点”。
    在一个四节点的星形结构中,某节点可能是中心节点或者边界外围的叶节点。
    基于角色的信息,可以为节点生成角色特征。

  • 基于 Graphlets 的结构特征聚合:
    在节点的邻域内分析有哪些 Graphlets,统计这些 Graphlets 的全局属性来构造节点特征。例如:

    • 邻域内以三角形为模式的 Graphlets 的数量。
    • 一个节点参与的 n 阶 Graphlets 的比例分布。

二、边任务

1、任务背景

基于已有的边预测新边,在测试集预测中,输出不存在的节点对排序,取前K个作为新边预测输出.其训练集标签可以通过两种方式构造,一是随机取消一部分边为标签,二是从时间跨度上取两个时点间差集的边集合做标签;排序方式可以根据新边的共同相邻节点数来进行.其关键是如何构建边的特征:

  • 基于距离的特征
  • 局部邻域重叠
  • 全局邻域重叠

2、基于距离的特征

如两节点间最短路径距离,如下图所示
在这里插入图片描述

3、局部邻域重叠

3.1 计算两个节点间的共有相邻节点数,如A,B节点公共相邻节点为C,因此局部邻域重叠值为1
3.2 还可以通过jaccard 系数计算,即两个节点间的共有相邻节点数除以两个节点间的相邻节点数之和,如A,B节点公共相邻节点为C,两者全部相邻节点为C,D,因此局部邻域重叠值为1/2
3.3 还可以考虑度的信息,为Adamic-Adar系数,将两个节点间的共有相邻节点的度取log求倒再加和得到,如A,B节点公共相邻节点为C,C的度为4,因此值为1/log(4)
在这里插入图片描述

4、全局邻域重叠

两个节点局部邻域重叠值为0时,其仍有概率在未来相连,因此引入全局的信息,katz 系数计算它基于节点之间的所有路径(包括非直接连接的路径),并根据路径的长度对其进行折减,较短的路径权重更高。该信息我们可以通过相邻矩阵进行计算得到.

在这里插入图片描述
其求解步骤如下
在这里插入图片描述
值得注意的是:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/70172.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【设计模式】【结构型模式】代理模式(Proxy)

👋hi,我不是一名外包公司的员工,也不会偷吃茶水间的零食,我的梦想是能写高端CRUD 🔥 2025本人正在沉淀中… 博客更新速度 👍 欢迎点赞、收藏、关注,跟上我的更新节奏 🎵 当你的天空突…

平板作为电脑拓展屏

有线串流(速度更快) spacedesk 打开usb对安卓的连接 用usb线直接连接电脑和平板 无线串流(延迟高,不推荐) todesk pc和手机端同时下载软件,连接后可以进行远程控制或扩展屏幕 spacedesk 连接到同一个…

[文末数据集]ML.NET库学习010:URL是否具有恶意性分类

文章目录 ML.NET库学习010:URL是否具有恶意性分类项目主要目的和原理项目概述主要功能和步骤总结数据集地址ML.NET库学习010:URL是否具有恶意性分类 项目主要目的和原理 项目主要目的: 本项目的目的是通过分析URL的特征,构建一个机器学习模型来判断给定的URL是否具有恶意…

Zotero PDF Translate插件配置百度翻译api

Zotero PDF Translate插件可以使用几种翻译api,虽然谷歌最好用,但是由于众所周知的原因,不稳定。而cnki有字数限制,有道有时也不行。其他的翻译需要申请密钥。本文以百度为例,进行申请 官方有申请教程: Zot…

具身智能在智能巡检机器人中的应用——以开关柜带电操作机器人为例

随着机器人技术和人工智能的迅速发展,具身智能在各行业的应用日益广泛,尤其是在电力行业中的智能巡检领域。传统的电力巡检和维护工作通常需要人工操作,存在着高温、高压、强电磁场等危险环境,且效率较低。开关柜带电操作机器人作…

网络工程师 (43)IP数据报

前言 IP数据报是互联网传输控制协议(Internet Protocol,IP)的数据报格式,由首部和数据两部分组成。 一、首部 IP数据报的首部是控制部分,包含了数据报传输和处理所需的各种信息。首部可以分为固定部分和可变部分。 固定…

【SpringBoot苍穹外卖】debugDay0 打开前端页面

在某一天学完后,电脑关机,再打开啥都忘了,记起来一点点,前端页面打不开,后端控制台一直循环出错。原来是下面这样哈哈。 查看端口是否被别的程序占用的操作步骤 winR输入cmd打开命令行 netstat -ano | findstr "8…

docker 运行 芋道微服务

jar包打包命令 mvn clean install package -Dmaven.test.skiptrue创建文件夹 docker-ai 文件夹下放入需要jar包的文件夹及 docker-compose.yml 文件 docker-compose.yml 内容:我这里的是ai服务,所以将原先的文件内容做了变更,你们需要用到什…

MySQL-事务隔离级别

事务有四大特性(ACID):原子性,一致性,隔离性和持久性。隔离性一般在事务并发的时候需要保证事务的隔离性,事务并发会出现很多问题,包括脏写,脏读,不可重复读,…

【MediaTek】 T750 openwrt-23.05编 cannot find dependency libexpat for libmesode

MediaTek T750 T750 采用先进的 7nm 制程,高度集成 5G 调制解调器和四核 Arm CPU,提供较强的功能和配置,设备制造商得以打造精巧的高性能 CPE 产品,如固定无线接入(FWA)路由器和移动热点。 MediaTek T750 平台是一款综合的芯片组,集成了 5G SoC MT6890、12nm 制程…

五十天精通硬件设计第32天-S参数

系列文章传送门 50天精通硬件设计第一天-总体规划-CSDN博客 目录 1. S参数基础 2. S参数在信号完整性中的作用 3. 单端 vs. 差分S参数 4. S参数的关键特性 5. S参数的获取与使用 6. S参数分析中的常见问题 7. 实际案例:PCIe通道分析 8. 工具推荐 总结 信号完整性中…

pytest asyncio 支持插件 pytest-asyncio

pytest 是 Python 测试框架,但其不支持基于 asyncio 的异步程序(例如,测试 FastAPI 异步代码),pytest-asyncio 是一个 pytest 插件,该插件赋予 pytest 可以测试使用 asyncio 库代码的能力。 https://github…

Transformer以及BERT阅读参考博文

Transformer以及BERT阅读参考博文 Transformer学习: 已有博主的讲解特别好了: 李沐:Transformer论文逐段精读【论文精读】_哔哩哔哩_bilibili知乎:Transformer模型详解(图解最完整版) - 知乎 个人杂想&…

分享一款AI绘画图片展示和分享的小程序

🎨奇绘图册 【开源】一款帮AI绘画爱好者维护绘图作品的小程序 查看Demo 反馈 github 文章目录 前言一、奇绘图册是什么?二、项目全景三、预览体验3.1 截图示例3.2 在线体验 四、功能介绍4.1 小程序4.2 服务端 五、安装部署5.1 快速开始~~5.2 手动部…

【R语言】回归分析与判别分析

一、线性回归分析 1、lm()函数 lm()函数是用于拟合线性模型(Linear Models)的主要函数。线性模型是一种统计方法,用于描述一个或多个自变量(预测变量、解释变量)与因变量(响应变量)之间的关系…

Visual Studio Code支持WSL,直接修改linux/ubuntu中的文件

步骤1 开始通过 WSL 使用 VS Code | Microsoft Learn 点击远程开发扩展包。 步骤2 Remote Development - Visual Studio Marketplace 点击install, 允许打开Visual Studio Code。 步骤3 共有4项,一齐安装。 步骤4 在WSL Linux(Ubuntu)中&#xf…

Unreal5从入门到精通之如何在 C++ 中创建 UserWidget

文章目录 前言UUserWidget 子类示例创建我们的 C++ 类的新蓝图子类更改现有蓝图的父类现在我们有了 C++ 基类,下一步做什么?蓝图还是 C++?结论前言 在之前的教程中,我展示了如何在编辑器中创建 UserWidget 蓝图, 在本教程中,我们将创建一个新的基于 C++ 的子类UUserWid…

利用雪花算法+Redis 自增 ID,生成订单号

在我们的项目中,我们需要定义一些全局唯一的 ID,比如订单号,支付单号等等。 这些ID有以下几个基本要求: 1、不能重复 2、不可被预测 3、能适应分库分表 为了生成一个这样一个全局的订单号,自定义了一个分布式 ID …

下载安装运行测试开源vision-language-action(VLA)模型OpenVLA

1. 安装 项目官网OpenVLA 首先按照官网提示的以下代码,执行创建环境->安装最小依赖->git克隆项目等 # Create and activate conda environment conda create -n openvla python3.10 -y conda activate openvla# Install PyTorch. Below is a sample comma…

Postman接口测试的cookie,token,session....鉴权

在接口测试过程中,常常需要进行Cookie、Token或Session等鉴权操作。Postman是一种流行的API开发环境,可以使用其自带的功能来进行这些鉴权操作。 下面是关于Postman接口测试中Cookie、Token和Session鉴权的详细介绍。 Cookie鉴权 在Postman中使用Cook…