【东南大学-朱鹏飞组-ICML25】用于退化的多模态图像融合的任务门控多专家协作网络


文章:Task-Gated Multi-Expert Collaboration Network for Degraded Multi-Modal Image Fusion

代码:https://github.com/LeeX54946/TG-ECNet

单位:东南大学


一、问题背景

多模态图像融合是安防监控、应急救援等场景的核心支撑技术,通过融合可见光与红外图像的互补信息,能显著提升复杂环境下的视觉感知能力。但实际应用中,成像设备易受外界干扰:

  • 可见光图像常面临噪声、模糊、雾霭等混合退化;

  • 红外图像因传感器特性,易产生明暗交替的条纹噪声;

  • 传统“先修复后融合”方案成本高、信息损耗大,现有一体化模型应对复杂退化能力不足,导致融合图像质量差、下游任务鲁棒性低。

二、方法创新

针对上述痛点,研究团队提出任务门控多专家协作网络(TG-ECNet),以“一体化框架+智能适配”思路实现退化图像的修复与融合,核心创新包括三点:

1. 统一任务框架

首次将多模态图像修复与融合任务整合到单一端到端模型中,避免传统串联方案的信息断裂问题,实现“一次输入、双重优化”的高效处理。

2. 任务感知门控与多专家协作

  • 退化感知门控:自动识别输入图像的退化类型(噪声、模糊、条纹等),动态选择最优专家组进行针对性修复;

  • 融合感知门控:通过多专家协作,智能权衡不同模态的特征贡献,精准聚合互补信息,兼顾修复效果与融合质量。

3. 两阶段训练策略

  • 第一阶段:聚焦修复任务,优化模型对各类退化的处理能力;

  • 第二阶段:专注融合任务,在不干扰修复效果的前提下,提升多模态特征整合精度,实现双任务的平衡优化。

4. 大规模基准数据集

构建含3万余组数据的DeMMI-RF数据集,覆盖6种退化类型(高/中/低高斯噪声、雾霭、散焦模糊、条纹噪声),包含无人机、驾驶等多视角场景,为相关研究提供可靠基准。

三、实验结果

在DeMMI-RF和EMS两大数据集上,TG-ECNet全面超越DRMF、Text-IF等主流模型,表现亮眼:

1. 定量指标领先

在CC(相关性)、PSNR(峰值信噪比)、MS-SSIM(结构相似度)等核心指标上均排名第一,其中PSNR达30.58,显著高于传统模型的29.5左右,说明图像质量与结构完整性更优。

2. 复杂场景表现突出

  • 极端噪声场景:能有效降噪并保留细节,而其他模型易出现模糊或噪声残留;

  • 雾霭+模糊混合退化:平衡去雾与去模糊效果,避免颜色失真;

  • 红外条纹噪声:精准抑制条纹同时,完整保留热目标信息,融合图像更清晰自然。

3. 下游任务鲁棒性强

将融合结果输入YOLOv5(目标检测)和Grounded-SAM(分割)模型,mAP50达0.969,分割准确率显著优于其他方法,能精准识别目标轮廓,避免误分、漏分。

四、优势与局限

核心优势

  1. 适配性强:无需提前定义退化类型,自动适配多种单一及混合退化场景;

  2. 效率更高:端到端框架减少中间环节,模型参数160.86M,兼顾性能与部署可行性;

  3. 实用性广:覆盖无人机、驾驶等多视角数据,适配安防、救援等实际应用场景。

现存局限

  1. 模型对超极端混合退化(如强噪声+厚雾+重度模糊)的处理效果仍有提升空间;

  2. 相比部分轻量模型,推理速度虽满足实用需求,但在实时性要求极高的场景(如高速移动目标监控)需进一步优化。

五、一句话总结

TG-ECNet通过任务门控与多专家协作机制,构建了退化多模态图像修复与融合的一体化框架,在复杂场景下实现了融合质量与下游任务鲁棒性的双重突破,为安防、救援等领域的高可靠视觉感知提供了新方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1098941.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Miniconda-Python3.10镜像中设置ulimit提升文件句柄数

Miniconda-Python3.10镜像中设置ulimit提升文件句柄数 在构建大规模AI训练环境或运行高并发数据处理任务时,你是否曾遇到过这样的报错? OSError: [Errno 24] Too many open files这行看似简单的错误,往往出现在最不该出现的时刻——模型已经跑…

Miniconda-Python3.10镜像支持文本分类任务的端到端流程

Miniconda-Python3.10镜像支持文本分类任务的端到端流程 在现代AI开发中,一个常见的困境是:代码在一个环境中运行完美,换一台机器却频频报错——“ImportError”、“CUDA版本不匹配”、“依赖冲突”……这些问题背后,往往不是算法…

Miniconda-Python3.10镜像在边缘计算设备上的轻量化部署

Miniconda-Python3.10镜像在边缘计算设备上的轻量化部署 在智能制造车间的一台边缘工控机上,工程师正通过笔记本远程调试视觉质检模型。他不需要登录现场,也不用担心环境不一致导致的“在我机器上能跑”的尴尬——一切依赖都已固化在一份 environment.ym…

Miniconda-Python3.10镜像中运行Flask Web服务的示例代码

在 Miniconda-Python3.10 环境中运行 Flask Web 服务:实战与最佳实践 在现代 AI 工程和数据科学项目中,一个常见的需求是将训练好的模型或数据处理逻辑封装成可被外部调用的 API。为了实现这一点,开发者往往需要快速搭建一个轻量、稳定且可复…

Miniconda-Python3.10镜像在智能家居控制系统中的嵌入

Miniconda-Python3.10镜像在智能家居控制系统中的嵌入 在一台部署于家庭地下室的边缘网关上,工程师正通过笔记本远程调试新上线的行为识别模型。他没有插任何显示器,也不需要上门服务——只需一条SSH隧道,就能安全访问运行在树莓派上的Jupyte…

Miniconda-Python3.10镜像支持视频内容理解的预处理流程

Miniconda-Python3.10镜像支持视频内容理解的预处理流程 在智能监控、自动驾驶和媒体推荐等应用快速发展的今天,视频数据已成为人工智能系统的重要输入来源。然而,这些高维度、非结构化且富含时序信息的数据,在进入模型训练前往往需要经过复杂…

Miniconda-Python3.10镜像中使用ncdu分析磁盘占用

Miniconda-Python3.10 环境中使用 ncdu 分析磁盘占用 在远程开发、AI 实验或容器化部署的日常中,你是否曾遇到这样的场景:Jupyter Notebook 提示“磁盘空间不足”,却完全不知道是哪个项目、哪个缓存文件悄悄吃掉了几十 GB 的存储?…

【TextIn大模型加速器 + 火山引擎】让AI读懂财报:30分钟搭建企业级金融分析Agent

文章目录一、 引言:当 AI 撞上“数据高墙”二、 准备工作1. 注册TextIn2. 注册火山引擎Coze,获取“最强大脑”三、 核心实操:构建数据清洗流水线 (ETL)1. 环境准备2. 复制并运行脚本3. 见证奇迹四、进阶实操:在 Coze 中注入“灵魂…

Miniconda+PyTorch+GPU:构建高性能AI算力环境的技术路径

Miniconda PyTorch GPU:构建高性能AI算力环境的技术路径 在深度学习项目中,最让人头疼的往往不是模型设计本身,而是“为什么代码在我机器上跑得好好的,换台设备就报错?”——这种经典的“在我机器上能跑”问题&#…

Miniconda-Python3.10镜像支持低代码平台后端逻辑扩展

Miniconda-Python3.10镜像支持低代码平台后端逻辑扩展 在当今企业数字化转型加速的背景下,低代码平台正从“快速搭建表单”的工具演进为支撑复杂业务系统的核心引擎。然而,当面对AI模型推理、实时数据清洗或跨系统集成等高级需求时,纯图形化配…

Miniconda-Python3.10镜像在舆情监测系统中的关键技术

Miniconda-Python3.10镜像在舆情监测系统中的关键技术 在当今信息爆炸的时代,社交媒体、新闻平台和论坛每天产生海量文本数据。政府机构需要实时掌握公众情绪动向,企业则依赖舆情分析来维护品牌形象、预警潜在危机。然而,构建一个稳定、可复现…

掌握Vivado固化程序烧写:Flash操作核心要点

Vivado固化程序烧写实战:从比特流到Flash的完整闭环在FPGA开发的世界里,有一个看似简单却常常让工程师踩坑的关键环节——如何让板子一上电就正常工作?如果你还在靠JTAG临时下载来验证功能,那你的项目还停留在“实验室阶段”。真正…

线上学习资源智能推荐系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】

💡实话实说:C有自己的项目库存,不需要找别人拿货再加价。摘要 随着互联网技术的快速发展和在线教育需求的激增,线上学习已成为现代教育的重要组成部分。然而,面对海量的学习资源,学习者往往难以高效筛选适合…

从零开始搭建深度学习环境:基于Miniconda-Python3.11的完整指南

从零开始搭建深度学习环境:基于Miniconda-Python3.11的完整指南 在人工智能项目开发中,最让人头疼的往往不是模型设计或训练调优,而是“为什么代码在我机器上能跑,在你那边就报错?”——这背后,九成概率是…

Miniconda-Python3.10镜像中配置auditd审计系统操作

Miniconda-Python3.10 镜像中配置 auditd 审计系统操作 在高校实验室、企业私有云 AI 平台或科研团队中,一个常见的痛点是:多个用户共享开发环境,有人随意升级包版本、修改全局配置,甚至误删关键模型文件。等到项目复现失败时&…

为什么你的小说总是烂尾?揭秘资深作者都在用的“沉浸式写作法”与提高写作效率的神器

如果你是一个写小说的新手,那我猜你现在最大的困难或许不是脑洞不足或者文笔不佳,而是进行不下去。做了这么久自媒体,后台看过几千份新人作家的开头。 说句得罪人的大实话:90%的新人不是输在文笔差,而是输在“想太多”…

工业控制项目中IAR软件安装实战案例

工业控制项目中 IAR 安装实战:从踩坑到高效部署的完整路径 在工业自动化领域,一个稳定、高效的开发环境,往往决定了项目的成败。我们团队曾在一个电机驱动器研发项目中,因为一名新工程师的 IAR 环境配置错误,导致整整…

Windows下Anaconda vs Miniconda配置PyTorch环境对比详解

Windows下Anaconda与Miniconda配置PyTorch环境的深度对比 在如今深度学习项目日益复杂的开发环境中,一个常见却令人头疼的问题是:为什么别人的代码在我电脑上跑不起来?明明都装了PyTorch,版本也对得上,可一运行就报错—…

Miniconda-Python3.10镜像中配置代理访问外网资源

Miniconda-Python3.10 镜像中配置代理访问外网资源 在企业级 AI 开发平台中,一个常见的痛点是:明明代码写好了,环境也搭了,却因为“装不上包”而卡住整个流程。特别是在金融、制造、医疗等对网络安全要求严格的行业,研…

AUTOSAR 学习效率翻倍:我如何把 CP/AP 规范重构成认知地图

AUTOSAR 学习效率翻倍:我如何把 CP/AP 规范重构成认知地图 先报个数吧。2025 年我在「嵌入式与硬件开发」写了 502 篇文章,访问量 594,368,点赞 12,388,收藏 10,903,代码片分享了 140 次,粉丝 6,491。 说实话,这些数字里我最在意的是"收藏"数。为啥?因为…