用于体素医学图像分割的跨视图差异-依赖网络/文献速递-基于人工智能的医学影像技术

2026.1.9

该研究提出了一种名为CvDd-Net的体积医学图像分割模型,通过利用多视图切片先验,并引入差异感知形态强化(DaMR)和依赖感知信息聚合(DaIA)模块来有效捕获视图间的差异和依赖性,从而显著提升了在全监督和半监督任务中对小目标分割的鲁棒性和准确性,尤其在数据有限的情况下表现出色。

Title题目

01

Cross-view discrepancy-dependency network for volumetric medical image segmentation

用于体素医学图像分割的跨视图差异-依赖网络

文献速递介绍

02

医学图像分割对临床应用至关重要,但手动勾勒3D图像工作量巨大且需专业知识。尽管深度学习方法在3D医学图像分割中取得进展,但面临数据稀缺的挑战。现有的补丁(patch-based)策略难以捕获长距离上下文信息,而仅使用单视图切片图像的方法忽略了其他两个视图的空间信息以及切片间的连续性。多视图学习虽被应用,但大多集中于结果层面的融合,忽视了不同视图间的差异和依赖性,限制了多视图先验的潜力。本文提出CvDd-Net,旨在通过多视图切片先验辅助体积表示学习,并探索视图差异和视图依赖来提升性能。

Aastract摘要

02

深度学习在体积医学图像分割中面临数据有限的挑战,现有方法通过多视图切片表示体积,但常牺牲层间空间连续性。为解决此问题,本文提出了一种跨视图差异-依赖网络(CvDd-Net),利用多视图切片先验辅助体积表示学习,并通过探索视图差异和视图依赖来提升性能。具体而言,该网络设计了一个差异感知形态强化(DaMR)模块,通过挖掘形态信息(如物体边界和位置)有效学习视图特定表示。同时,开发了一个依赖感知信息聚合(DaIA)模块,充分利用多视图切片先验来增强各视图表示,并基于跨视图依赖进行集成。在甲状腺、宫颈、胰腺和胶质瘤四个医学图像数据集上进行的广泛实验表明,该方法在全监督和半监督任务中均表现出显著的有效性。

Method方法

03

CvDd-Net包含两个编码器、一个差异感知形态强化(DaMR)模块、一个依赖感知信息聚合(DaIA)模块和一个解码器。首先,通过预训练的切片模型获取多视图切片表示作为先验。DaMR模块通过残差上下文映射(RCM)捕获相邻切片间的边界信息,并通过坐标注意力(CA)编码视图特定表示的位置信息,以增强视图差异。DaIA模块首先通过跨维度依赖感知关系(CdDR)将多视图切片先验(即Sa, Ss, Sc)整合到体积表示中,通过空间和通道维度上的相关性增强各视图的表示。然后,通过跨视图依赖感知关系(CvDR)利用自注意力机制,建模不同视图特征间的长距离关系,特别是强调轴向视图信息,实现多视图信息的有效聚合。

Discussion讨论

04

外部验证结果(使用额外的宫颈癌患者CT扫描)进一步证明了CvDd-Net在全监督和半监督设置下均具有出色的泛化能力,这得益于其对多视图互补信息的有效利用。通过t-SNE可视化特征,表明模型能良好地分离前景和背景像素,实现类内紧凑和类间分离。参数分析显示,CdDR和CvDR中的可学习权重(w1-w5)能根据不同数据集自适应调整,优于固定权重设置,这对于提高模型对新数据集的适应性很重要。复杂度分析表明,CvDd-Net在实现高性能的同时,参数数量和FLOPs相对较少,表明性能提升主要归因于多视图切片表示的高效利用而非模型复杂度的增加。这些结果共同支持了CvDd-Net在体积医学图像分割领域的有效性和潜力。

Conclusion结论

05

本文提出了一种用于体积医学图像分割的CvDd-Net,该网络利用多视图切片先验,并通过差异感知形态强化(DaMR)模块学习视图特定表示,通过依赖感知信息聚合(DaIA)模块整合多视图信息。在四个数据集上的广泛实验证明了该方法在模型尺寸相对较小的情况下仍能有效提升性能,尤其在小目标分割中表现出色。同时,CvDd-Net在半监督任务中展现出比现有方法更高的性能,凸显了多视图学习在数据有限应用中的潜力。

Results结果

06

在甲状腺、宫颈、胰腺和胶质瘤四个医学图像数据集上的实验结果表明,CvDd-Net在Dice系数、Jaccard指数和95%Hausdorff距离等指标上均优于其他主流的3D骨干网络、多视图分割方法和任务特定网络。定性比较显示,CvDd-Net能更准确地勾勒物体边界,并生成更平滑、连续的分割结果。消融研究证实了DaMR模块中的RCM和CA组件、以及DaIA模块中的CdDR和CvDR组件的有效性,它们对增强视图差异和整合多视图信息至关重要。研究还发现,CvDd-Net在不同3D骨干网络下均能保持竞争力,并且在有限数据量的半监督任务中,CvDd-Net也显著优于现有的半监督方法,显示出对数据稀缺的鲁棒性。

Figure

07

图1. CvDd-Net的流程图。它由一个用于特征提取和预测图生成的编码器和解码器(蓝色)组成。此外,它还包括:(a) 一个用于多视图切片表示学习的切片编码器(绿色),(b) 一个用于视图特定表示学习的差异感知形态强化(DaMR)模块,以及(c) 一个用于多视图表示融合的依赖感知信息聚合(DaIA)模块。

图2. 差异感知形态强化模块的示意图。RCM:残差上下文映射;CA:坐标注意力。

图3. 依赖感知信息聚合模块的示意图。CdDR:跨维度依赖感知关系;CvDR:跨视图依赖感知关

图4. 所有竞争方法在甲状腺(顶部)和宫颈(底部)数据集上一些代表性病例的可视化结果。第一行和第三行中的蓝色和橙色线条分别表示预测图和真实值的边界。最后一列名为GT表示原始图像及其真实值。

图5. 所有竞争方法在胰腺(顶部)和胶质瘤(底部)数据集上一些代表性病例的可视化结果。第一行和第三行中的蓝色和橙色线条分别表示预测图和真实值的边界。最后一列名为GT表示原始图像及其真实值。

图6. 所有半监督方法在甲状腺、宫颈、胰腺和胶质瘤(从上到下)数据集上一些代表性病例的定性比较。分割结果来自使用50%数据训练的模型。蓝色和橙色线条分别表示预测和真实值的边界。最后一列名为GT表示原始图像及其真实值。

图7. 来自四个数据集的t-SNE可视化,用于验证CvDd-Net的表示学习直觉。

图8. CvDd-Net中间层特征图的可视化。从左到右依次为 (a) 带GT的原始图像,特征图 (b) 编码器之后(RCM之前),(c) RCM之后(CA之前),(d) CA之后(CdDR之前),(e) CdDR之后(CvDR之前),以及 (f) CvDR之后(解码器之前)。

9. 不同数据集上自适应权重(CdDR中的w1和w2,以及CvDR中的w3、w4和w5)的定性结果。

图10. 使用25%数据训练的CvDd-Net中间层特征图的可视化。从左到右依次为 (a) 带GT的图像,(b) 轴向视图的表示,(c) 矢状视图的表示,以及 (d) 冠状视图的表示。具体而言,来自不同视图的三列特征(从左到右)分别为:(1) 切片表示,(2) CA之后(CdDR之前)的特征图,以及(3) CdDR之后(CvDR之前)的特征图。

图11. 不同模型在四个数据集上的复杂度分析。横轴和纵轴分别表示模型的参数数量和Dice相似系数,圆形的大小表示模型的FLOPs。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1137215.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

I2C与UART对比入门:初学者的核心区别分析

I2C与UART实战入门:从连线到选型的全维度对比你有没有遇到过这种情况:手头有两个传感器,一个用I2C,一个用UART;主控芯片引脚又紧张;调试时串口输出还和另一个模块冲突……最后只能反复改电路、换引脚、加电…

或非门在工业控制中的逻辑设计:深度剖析应用原理

或非门如何成为工业控制中的“安全守护神”?在自动化车间里,一台设备突然失控,操作员按下急停按钮——千钧一发之际,是PLC程序响应?还是某个嵌入式系统从休眠中唤醒?都不是。真正起决定性作用的&#xff0c…

开源模型落地实践|Qwen2.5-7B-Instruct结构化生成全解析

开源模型落地实践|Qwen2.5-7B-Instruct结构化生成全解析 一、引言:为何结构化输出成为大模型落地的关键能力? 随着大语言模型(LLM)在企业级应用中的深入,非结构化文本生成已无法满足生产环境对数据可解析…

模拟I2C协议在远程IO模块中的操作指南

模拟I2C驱动远程IO:从原理到实战的完整指南你有没有遇到过这样的场景?主控芯片上的硬件I2C接口已经用完,但项目又急需扩展十几个数字输入输出点。或者,你在工业现场调试时发现,标准I2C通信在长线传输下频繁丢包&#x…

拒绝“天价”硬件吃灰:企业AI转型如何避开“只烧钱不落地”的深坑?

在数字化转型的浪潮下,很多企业管理者都面临着一种尴尬的“AI焦虑”:不搞AI怕被时代淘汰,搞了AI却发现是个“无底洞”。许多老板在听完各种高大上的概念后,大手一挥批预算,购买昂贵的GPU服务器、搭建复杂的机房环境。然…

基于SPICE的二极管IV特性曲线全面讲解

从零开始搞懂二极管IV曲线:用SPICE仿真揭开非线性特性的真相你有没有遇到过这种情况?设计一个电源电路时,明明理论计算没问题,可实测发现效率偏低、发热严重。排查半天,最后发现问题竟出在那个不起眼的“小二极管”上—…

Qwen2.5-7B代码解释:程序理解与注释生成

Qwen2.5-7B代码解释:程序理解与注释生成 1. 技术背景与核心价值 1.1 大模型在代码理解中的演进需求 随着软件系统复杂度的持续上升,开发者对自动化代码理解、文档生成和维护支持的需求日益迫切。传统静态分析工具虽能解析语法结构,但在语义…

RS485协议驱动开发:项目应用中的代码优化策略

RS485驱动开发实战:从时序坑点到高效通信的代码精进之路在工业现场,你是否遇到过这样的场景?系统明明运行正常,但每隔几分钟就丢一帧数据;主站轮询电表,偶尔收到乱码;多个节点同时响应&#xff…

优化I2S音频抗干扰能力:操作指南与实践

让I2S不再“咔哒”:从PCB到代码,打造抗干扰音频链路的实战笔记最近在调试一款工业级语音采集模块时,又碰上了那个老对手——I2S音频中的周期性“咔哒”声。设备一靠近变频器,声音就开始断续,像是被电磁噪声“咬了一口”…

基于MATLAB的周期方波与扫频信号生成实现(支持参数动态调整)

一、周期方波信号生成 1. 核心函数与参数 function [t, y] generate_square_wave(f, A, duty, T, fs)% 参数说明:% f: 基频 (Hz)% A: 幅值 (V)% duty: 占空比 (0-100%)% T: 信号周期 (s)% fs: 采样率 (Hz)t 0:1/fs:T; % 时间向量(覆盖1个周期…

手把手教你用Driver Store Explorer清理无效驱动

让老电脑“瘦身”成功:用这款神器精准清理Windows无效驱动 你有没有遇到过这样的情况?一台用了三四年的笔记本,SSD只有256GB,系统盘却总是提示空间不足。明明没装几个软件,杀毒扫描也没发现大文件,可 C:\…

零成本实现文档智能:本地化 OCR 提取与 AI 处理全流程实战

合同、发票、报销单、身份证等文档往往包含大量敏感信息。在实际项目中,处理这类文档从来都不只是一个技术问题,而是同时受到隐私合规、成本控制与系统架构约束的综合工程问题。 目前较为常见的做法是:将文档上传至云端,调用 OCR …

Hyper-V冲突导致HAXM无法安装?解决方案详解

Hyper-V冲突导致HAXM无法安装?别慌,一文彻底解决!你是不是也遇到过这种情况:兴冲冲打开Android Studio,准备调试刚写的App,结果点开AVD(Android Virtual Device)时弹出一个红框警告&…

手把手实现LVGL显示驱动配置流程

手把手实现LVGL显示驱动配置流程:从零点亮一块TFT屏幕你有没有过这样的经历?手里的STM32板子焊好了,ILI9341屏幕也接上了,LVGL库也移植进去了,结果一通电——黑屏、花屏、半屏显示、刷新卡顿……别急,这不是…

SMBus协议错误处理机制在电源管理中的影响:系统解析

SMBus协议在电源管理中的实战可靠性设计:从错误处理到系统稳定你有没有遇到过这样的情况?系统上电后,BMC(基板管理控制器)迟迟无法读取电压调节器的状态,日志里满屏的“SMBus NACK”错误;或者服…

Qwen2.5-7B大模型离线部署指南|vLLM加速落地

Qwen2.5-7B大模型离线部署指南|vLLM加速落地 在当前大语言模型(LLM)快速发展的背景下,如何高效、低成本地将高性能模型部署到生产环境,成为企业与开发者关注的核心问题。Qwen2.5-7B作为通义千问系列中性能卓越的开源大…

基于第三方中转的高效 Sora-2 接口集成方案

针对 OpenAI 官方接口调用成本高、QPS 限制严的问题,本文提供一种基于小镜 AI 开放平台的解决方案。该方案完全兼容 OpenAI Chat Completions 协议,支持多种分辨率参数配置,实现低延时、低成本的视频渲染。 核心对接流程: 凭证获…

HY-MT1.5-1.8B 支持多语言神经机器翻译;Med-Banana-50K 提供医学影像编辑基准数据

公共资源速递 6 个公共数据集: * Human faces 人脸数据集 * SimpleQA 简明事实性问答评测数据集 * Med-Banana-50K 医学图像编辑数据集 * DeepSearchQA 多步信息搜索问答数据集 * TongSIM-Asset 具身智能模拟资产数据集 * Calories Burnt Prediction 卡路里消…

快速理解USB over Network在Win平台的工作机制

深入Windows平台的USB over Network:从驱动到网络的透明外设共享你有没有遇到过这样的场景:公司唯一的硬件加密狗插在办公室某台电脑上,而你正在家里远程办公;或者实验室里那台精密仪器只能通过本地USB连接,但数据分析…

Coinstore B.KU 数字金融与 RWA 主题活动圆满举行

2025 年 1 月 8 日,由 Coinstore B.KU 主办的「数字金融与 RWA(Real World Assets,现实世界资产)主题活动」顺利举行。来自数字金融、区块链技术、传统产业及国际组织的多位嘉宾齐聚现场,围绕 RWA 发展趋势、数字金融结…