2025.4.21-2025.4.26学习周报

目录

    • 摘要
    • Abstract
    • 1 文献阅读
      • 1.1 模型架构
        • 1.1.1 动态图邻接矩阵的构建
        • 1.1.2 多层次聚合机制模块
        • 1.1.3 AHGC-GRU
      • 1.2 实验分析
    • 总结

摘要

在本周阅读的论文中,作者提出了一种名为AHGCNN的自适应层次图卷积神经网络。AHGCNN通过将监测站点视为图结构中的节点,利用图卷积网络捕捉复杂的空间依赖性,并结合时间序列建模可以准确的预测未来空气质量变化。相较于传统模型,AHGCNN通过数据驱动的邻接矩阵生成,摒弃了依赖先验知识的固定邻接矩阵,从历史数据中学习站点间的真实空间关系,反映空气质量受气象条件、风向等动态因素影响的特性。其自适应动态图结构通过层次映射图卷积,动态调整邻接矩阵,适应随时间变化的空间依赖性,捕捉污染扩散等动态过程。此外,AHGCNN利用注意力机制整合多层图卷积的输出,自动选择对预测任务最有价值的信息,增强了对复杂时空模式的建模能力。尽管模型在建模上更为复杂,但通过降维技术和参数共享,其参数量和训练时间均保持在较低水平,展现出了良好的实用性。

Abstract

In the paper read this week, the author proposed an adaptive hierarchical graph convolutional neural network called AHGCNN. AHGCNN can accurately predict future air quality changes by treating monitoring stations as nodes in a graph structure, capturing complex spatial dependencies using graph convolutional networks, and combining them with time series modeling. Compared to traditional models, AHGCNN generates a data-driven adjacency matrix, abandoning the fixed adjacency matrix that relies on prior knowledge. It learns the real spatial relationships between stations from historical data and reflects the dynamic factors such as meteorological conditions and wind direction that affect air quality. At the same time, its adaptive dynamic graph structure dynamically adjusts the adjacency matrix through hierarchical mapping graph convolution, adapts to temporal spatial dependencies, and captures dynamic processes such as pollution diffusion. In addition, AHGCNN utilizes attention mechanisms to integrate the outputs of multi-layer graph convolutions, automatically selecting the most valuable information for prediction tasks, enhancing its ability to model complex spatiotemporal patterns. Although the model is more complex in modeling, its parameter count and training time are kept at a low level through dimensionality reduction techniques and parameter sharing, demonstrating good practicality.

1 文献阅读

本周阅读了一篇名为Learning spatiotemporal dependencies using adaptive hierarchical graph convolutional neural network for air quality prediction的论文
论文地址:添加链接描述
在这里插入图片描述

AHGCNN通过创新的自适应动态图结构和多层次聚合机制,有效捕捉了空气质量数据中的复杂时空依赖性。实验结果表明,AHGCNN在短期和长期预测中均表现出色,且计算成本较低,具有实际应用的潜力。

1.1 模型架构

AHGCNN将监测站视为图结构中的节点,利用图卷积网络处理空间关系,同时结合了时间序列建模来预测未来趋势。AHGCNN的总体架构由以下三个核心模块组成:自适应动态图结构构建模块、多层次聚合机制模块和编码和解码模块。结构如下图所示:
在这里插入图片描述
首先,模型先用处理好的数据构建邻接矩阵,通过HGMC模块进行图零阶矩阵的动态调整,将最后构建确认的图结构输入到多层图卷积中进行特征聚合,通过AHGC-GRU编码器将聚合特征进行时间序列的建模,最后经模型的解码器生成最后的预测结果,各部分的详细分析如下:

1.1.1 动态图邻接矩阵的构建

空气质量的空间依赖性会随时间变化,例如风向改变或污染源移动会导致站点间的关系动态调整。传统GCN使用固定的邻接矩阵,无法捕捉这种变化。AHGCNN通过层次映射图卷积(Hierarchical Mapping Graph Convolution, HMGC)*动态更新每一层的邻接矩阵 Am,使其适应当前时间步的空间特性。这部分通过降维技术减少参数量,提高计算效率。
在这里插入图片描述
在这里插入图片描述

这种方法可以和之前学过的另一种动态图邻接矩阵的生成形成对比,它是通过注意力机制来实现的,其构建过程如下所示:
(1)首先,将每个站点在当前时间步的数据特征输入模型,通过一个线性变换(这里通常是一个全连接层),将这些特征映射到一个高维空间,生成每个站点的嵌入向量。
(2)通过空间注意力机制进行注意力分数计算
(3)将每个站点的所有相似度分数输入一个Softmax函数进行归一化。归一化后的结果表示的就是站点之间的连接强度。
此后将所有归一化后的注意力分数填入矩阵中,就得到了当前时间步的动态邻接矩阵。
以一个简单的例子为例:
在这里插入图片描述在这里插入图片描述

其代码实现如下:

import numpy as np# 站点数量
num_nodes = 3# 时间步 t=1 的流量特征
features_t1 = np.array([1, 2, 3]).reshape(-1, 1)# 时间步 t=2 的流量特征
features_t2 = np.array([3, 1, 2]).reshape(-1, 1)# 1. 构建静态邻接矩阵
A_static = np.array([[0, 1, 1],[1, 0, 1],[1, 1, 0]
])print("静态邻接矩阵 A_static:\n", A_static)# 2. 构建动态邻接矩阵(使用点积注意力)
def compute_dynamic_adj(features):# 计算注意力分数(点积)scores = np.dot(features, features.T)# 减去每行的最大值,防止溢出scores_stable = scores - np.max(scores, axis=1, keepdims=True)# Softmax 归一化(按行归一化)exp_scores = np.exp(scores_stable)A_dynamic = exp_scores / np.sum(exp_scores, axis=1, keepdims=True)return A_dynamic# 时间步 t=1 的动态邻接矩阵,精确到小数点后四位
A_dynamic_t1 = compute_dynamic_adj(features_t1)
print("\n时间步 t=1 的动态邻接矩阵 A_dynamic_t1:\n", np.round(A_dynamic_t1, 4))# 时间步 t=2 的动态邻接矩阵,精确到小数点后四位
A_dynamic_t2 = compute_dynamic_adj(features_t2)
print("\n时间步 t=2 的动态邻接矩阵 A_dynamic_t2:\n", np.round(A_dynamic_t2, 4))

得到输出如下:

静态邻接矩阵 A_static:[[0 1 1][1 0 1][1 1 0]]时间步 t=1 的动态邻接矩阵 A_dynamic_t1:[[0.09   0.2447 0.6652][0.0159 0.1173 0.8668][0.0024 0.0473 0.9503]]时间步 t=2 的动态邻接矩阵 A_dynamic_t2:[[0.9503 0.0024 0.0473][0.6652 0.09   0.2447][0.8668 0.0159 0.1173]]
1.1.2 多层次聚合机制模块

图卷积网络通常有多层结构,每一层的输出捕捉不同尺度的空间依赖性。传统方法仅使用最后一层的输出,可能丢失低层特征中的局部信息。AHGCNN通过注意力机制整合多层输出根据每一层的贡献动态加权,生成最终特征表示。这种方法增强了模型对重要信息的选择能力。

在这里插入图片描述

通过注意力机制,模型能够自适应地聚焦于对预测任务最有价值的层级特征,例如短期局部扩散或长期区域趋势。

1.1.3 AHGC-GRU

AHGCNN采用序Seq2Seq架构,其中编码器和解码器由AHGC-GRU组成。编码器处理历史数据,提取时空特征;解码器基于这些特征生成未来预测值。AHGC-GRU结合了HMGC的空间建模能力和GRU的时间建模能力,其结构如下图所示:
在这里插入图片描述
它的输入是当前时间步的特征 ht 和上一时刻的隐藏状态Ht-1。通过将传统的GRU的门控机制转换为AHGC操作,通过​​门控机制改造​​,将传统GRU中的全连接层替换为自适应层次图卷积(AHGC),使得模型能够捕捉空间依赖​​:通过动态图卷积建模站点间的隐含关;​​平衡了时空特征​​:更新门和重置门动态调整历史状态与当前输入的权重。除此也实现了更高效的计算,参数共享和低秩分解降低复杂度,适合大规模传感器网络。

1.2 实验分析

(1)数据集
实验使用的数据集来自北京的39个站点,数据来自2018年1月1日至2020年12月31日,其中包含PM₂.₅、PM₁₀、SO₂、NO₂、CO、O₃、AQI及气象数据(压力、气温等)。
(2)评估标准
MAE:
在这里插入图片描述
RMSE:
在这里插入图片描述
基线模型由传统循环神经网络(LSTM、GRU、RNN)、时空图神经网络(Graph-WaveNet、DCRNN、MLSTGCN)以及基于Transformer的模型(Informer、FFTransformer)组成。
(3)实验结果
1)参数设置
​​历史序列长度与预测长度​​:设置为24小时,符合PM2.5日变化规律。
​​自适应矩阵维度​​(L=13):通过SVD分解平衡计算复杂度和信息保留。
​​学习率​​(0.0005):采用Adam优化器,避免梯度爆炸。
​​初始化策略​​:权重矩阵初始化为单位矩阵,偏置为零,确保训练初期稳定性。
在这里插入图片描述
由上图结果可知,模型在15轮迭代后收敛,训练损失稳定在0.1,验证损失约0.4,表明参数配置合理,未出现过拟合。

2)实验对比
为验证AHGCNN相对于传统模型(RNN/LSTM/GRU)和先进时空模型(Graph-WaveNet/DCRNN等)的优越性,实验将其与基线模型进行了对比:
在这里插入图片描述
RNN/LSTM/GRU的MAE(20.67–25.68)显著高于AHGCNN(15.84),说明忽略空间依赖严重限制性能。AHGCNN在1h预测中MAE(5.32)优于Graph-WaveNet(5.80)和DCRNN(6.45),显示动态图结构捕捉突发污染事件的能力。相比MLSTGCN(MAE=16.33),AHGCNN的层次聚合机制提升多尺度特征融合效果。Informer和FFTransformer因局部突变预测能力不足,MAE(16.47–16.78)高于AHGCNN。
3)网络架构影响实验
该部分的实验是为了验证HMGC层数对模型性能的影响,确定最优层级数,实验结果如下:
在这里插入图片描述
由上图可知,3层HMGC平衡了计算成本与特征表达能力。
4)性能对比
该部分实验是为了验证AHGCNN在不同预测时间点(1h–24h)的稳定性,其结果如下:
在这里插入图片描述
在这里插入图片描述

在短期预测​​中AHGCNN的MAE显著优于DCRNN和Graph-WaveNet,因动态图结构快速响应局部突变。在长期预测​​中MAE仍优于基线,因为层次聚合可以缓解误差累积。在​​突变时段表现中,AHGCNN在PM2.5骤升时预测误差最小,传统模型因空间信息缺失严重偏离真实值。
5)消融实验
为验证AHGCNN各组件(自适应图、注意力聚合)的必要性,作者进行了消融实验,作者设置了4个变体:
​​Distance_ini​​:用预定义距离矩阵替换自适应图。
​​W/O adaptive​​:固定单层图结构。
​​W/O attention​​:移除多级注意力聚合。
​​W/O both​​:同时移除自适应和注意力。
在这里插入图片描述
W/O adaptive的MAE高于AHGCNN,说明了动态图捕捉隐含依赖的关键作用,W/O attention的MAE证明了多级特征融合的必要性,W/O both的MAE证实了组件协同提升性能。

总结

通过本次的学习,我明白同一种技术的实现可能是有不同方法的,例如动态图邻接矩阵的实现就可以由本次论文中的方法或者是通过注意力机制来实现。在后续的研究的过程中,这里的思想是可以进行借鉴的,不必为了一种方法死磕。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/77461.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

6.1 客户服务:智能客服与自动化支持系统的构建

随着企业数字化转型的加速,客户服务作为企业与用户交互的核心环节,正经历从传统人工服务向智能化、自动化服务的深刻变革。基于大语言模型(LLM)和智能代理(Agent)的技术为构建智能客服与自动化支持系统提供…

java Optional

我还没用过java8的一些语法,有点老古董了,记录下Optional怎么用。 从源码看,Optional内部持有一个对象, 有一些api对这个对象进行判空处理。 静态方法of ,生成Optional对象, 但这个value不能为空&#…

【Java面试笔记:进阶】24.有哪些方法可以在运行时动态生成一个Java类?

在Java中,运行时动态生成类是实现动态编程、框架扩展(如AOP、ORM)和插件化系统的关键技术。 1.动态生成Java类的方法 1.从源码生成 直接生成源码文件:通过Java程序生成源码并保存为文件。编译源码: 使用ProcessBuilder启动javac进程进行编译。使用Java Compiler API(ja…

基于Jamba模型的天气预测实战

深入探索Mamba模型架构与应用 - 商品搜索 - 京东 DeepSeek大模型高性能核心技术与多模态融合开发 - 商品搜索 - 京东 由于大气运动极为复杂,影响天气的因素较多,而人们认识大气本身运动的能力极为有限,因此以前天气预报水平较低 。预报员在预…

GAMES202-高质量实时渲染(Real-Time Shadows)

目录 Shadow MappingshadowMapping的问题shadow mapping背后的数学PCF(Percentage Closer Filtering)PCSS(Percentage closer soft shadows)VSSM(Variance Soft Shadow Mapping)优化步骤3优化步骤1SAT&…

iphonex uniapp textarea标签兼容性处理过程梳理

嗨,我是小路。今天主要和大家分享的主题是“iphonex uniapp textarea标签兼容性处理过程梳理”。 在uniapp项目中,经常会使用到uniapp原生的textarea标签,但在手机兼容性这块,textarea并不是很好用,会出现一些…

C++ 区分关键字和标识符

1. 关键字(Keywords) 定义:关键字是编程语言预定义的具有特定意义的单词。它们是语言的一部分,C编译器具有特殊的理解规则,不能作为用户自定义的标识符。作用:关键字用于定义语言结构,如声明变…

杭电oj(1087、1203、1003)题解

DP 即动态规划(Dynamic Programming),是一种通过把原问题分解为相对简单的子问题,并保存子问题的解来避免重复计算,从而解决复杂问题的算法策略。以下从几个方面简述动态规划: 基本思想 动态规划的核心在…

一键多环境构建——用 Hvigor 玩转 HarmonyOS Next

引言 在 HarmonyOS Next 的应用开发中,常常需要针对不同环境(测试、预发、线上)或不同签名(调试、正式)输出多个 APP/HAP 包。虽然 HarmonyOS 提供了多目标构建(Multi-Target Build)能力&#…

qt/c++云对象浏览器

简介 本项目为基于QT5和C11的云对象存储可视化管理工具 源码获取 int main(){ printf("源码联系绿泡泡:%s","joyfelic"); return 0; }

【Ubuntu】提升 docker ps -a 输出的可读性:让 Docker 容器状态更清晰

提升 docker ps -a 输出的可读性:让 Docker 容器状态更清晰 当我们使用 docker ps -a 查看所有 Docker 容器时,输出的信息通常会非常多,尤其是在容器数量较多时。默认输出中包含容器 ID、名称、镜像、状态、端口等信息,容易让人眼…

Spring Security自定义身份认证

尽管项目启动时,Spring Security会提供了默认的用户信息,可以快速认证和启动,但大多数应用程序都希望使用自定义的用户认证。对于自定义用户认证,Spring Security提供了多种认证方式,常用的有In-Memory Authentication…

在亚马逊云服务器上部署WordPress服务

在亚马逊云服务器上部署WordPress服务第一步:创建EC2实例第二步:初始设置与安装第三步:配置MySQL与WordPress第四步:配置Apache与WordPress第五步:访问WordPress第六步:测试数据库连接第七步:使…

Web3.0的认知补充(去中心化)

涉及开发技术: Vue Web3.js Solidity 基本认知 Web3.0含义: 新一代互联网思想:去中心化及用户为中心的互联网 数据:可读可写可授权 核心技术:区块链、NFT 应用:互联网上应用 NFT &…

如何修复宝可梦时时刻刻冒险无法正常工作

宝可梦的时时刻刻冒险模式是一项强大的功能,即使应用程序关闭,它也能追踪你的步行距离。它的工作原理是将你的步数与 iOS 上的 Apple Health 或 Android 上的 Google Fit 同步。它对于孵化宝可梦蛋和赚取好友糖果至关重要,但一旦它停止工作&a…

redis常用集合操作命令

在 Redis 的命令行界面(redis-cli)中, Redis 的集合(Set)是无序的,且集合中的元素是唯一的。Redis 本身没有直接提供获取集合中某个特定属性的命令,因为集合中的元素是简单的值,而不…

初识数据结构——二叉树从基础概念到实践应用

数据结构专栏 ⬅(click) 初识二叉树:从基础概念到实践应用🌳 一、树型结构基础 1.1 树的基本概念 树是一种非线性的数据结构,由n(n>0)个有限节点组成一个具有层次关系的集合。它看起来像一棵倒挂的树,根朝上而叶朝下。 关键特…

驼峰命名法(Camel Case)与匈牙利命名法(Hungarian Notation)详解

驼峰命名法(Camel Case)与匈牙利命名法(Hungarian Notation)详解及对比‌ ‌1. 驼峰命名法(Camel Case)‌ ‌定义‌ 驼峰命名法(Camel Case)是一种变量、函数、类等标识符的命名方…

keil 中优化等级的bug

一,问题描述 程序中代码有的执行,有的不执行,仔细研究,查询人工智能。 程序中printf打印后面的代码不执行, 然后过几十个函数又开始正常了。 二.分析问题 跳过函数一般又判断和Goto等语句,其它的溢出和错误…

织梦dedecms网站如何修改上一篇下一篇的标题字数

一般情况下,如果你的上一篇和下一篇是2行布局就不需要限制标题的字数了,如果你要一行布局上一篇和下一篇标题过长就会打乱网页布局,那么限制上一篇和下一篇的标题字数是需要的,避免页面看起来杂乱不堪。 织梦dedecms网站如何修改…