性能远超SAM系模型,苏黎世大学等开发通用3D血管分割基础模型

如果把人的身体比作一座庞大的城市,那么血管无疑就是这座城市的「道路」,动脉、静脉以及毛细血管对应着高速公路、城市道路以及乡间小道,它们相互协作,通过血液将营养物质、氧气等输送到身体各处,从而维持着这座「城市」的高效、稳定运行。而当这些道路出现问题时,人们的身体自然也会随之发生病变。

血管分割是检查这些「道路」是否存在问题的重要手段,如同城市建设中通过交通影像发现问题一般,它是医学图像处理中的一项关键任务。血管分割可以从医学图像中精准识别和提取血管的结构,从而应用于各种血管疾病的分析、诊断和治疗,例如在心血管疾病方面,对冠状动脉血管的分割有助于医生评估血管的狭窄程度,从而为患者制定合适的治疗方案。

近些年,血管分割在计算机和医学影像技术的加持下已经取得了显著进步。然而,当面对特定任务的成像时,准确和稳健的分割全连接的血管仍是一个具有挑战性的问题,尤其是在 3D 血管分割中。一方面是血管自身原因所限,复杂微小的血管几何形状带来的分割难度的陡然增长;另一方面是由成像方式和协议所限,特定的信噪比、血管模式、成像伪影以及背景组织的变化引起的显著域间隙。

虽然目前出现了多种基于基础模型的医学影像分割方法,如 SAM(Segment Anything Model)以及针对 3D 医学图像的 SAM-Med3D、VISTA3D 等,但这些模型在血管分割任务中仍存有局限性。因此,3D 血管分割对于医护人员和研究人员而言仍然是一项劳动密集型的工作,需要进行大量手动的体素级注释才能进一步实现准确的血管图像分析。

针对于此,来自苏黎世大学、苏黎世联邦理工学院和慕尼黑工业大学的团队提出了一个专为 3D 血管分割而设计的基础模型 vesselFM。该模型在一个大规模数据集(Dreal)及通过域随机化(Ddrand)和基于流匹配的生成模型(Dflow)生成的合成数据上进行训练,能够在零样本、单样本和少样本场景中实现优于现有先进模型的分割能力和泛化能力。

相关研究以「vesselFM: A Foundation Model for Universal 3D Blood Vessel Segmentation」为题发表,并入选了 CVPR 2025。

研究亮点:

* 研究提出了一种具有零样本、泛化能力的 3D 血管分割通用基础模型,可供研究人员和医护人员「开箱即用」

* 团队策划了最大的 3D 血管分割数据集,包括经过精心处理的真实 3D 血管图像和匹配的体素级注释

* 研究提出了一种针对 3D 血管分割的精细领域随机化策略,同时将流匹配引入 3D 医学图像生成当中。

图片

论文地址:
https://go.hyper.ai/lVad9
 

数据集:3 个异构数据源

研究人员使用了 3 个异构数据源对其进行训练,首先是一个内含不同真实数据的数据集 Dreal(Diverse Real Data);其次为 2 个合成数据源,分别是领域随机数据集 Ddrand(Domain Randomization)以及从基于流匹配的生成模型中采集的数据 Dflow(Flow Matching-Based)。

其中,Dreal 是迄今为止应用于 3D 血管分割任务中最大的真实数据集,涵盖来自不同生物体的各种解剖区域的广泛成像模式,包含了 17 个注释来源的超 115,000 个形状为 128³ 的 3D patches。具体来说,其广泛的临床成像包括 MRA、CTA、X 光片、双光子显微镜以及 vEM 等,生物样本来自人类、实验鼠的大脑、肾脏和肝脏等,这为研究提供了不同结构和功能特性的血管模式。如下图所示。

图片

Dreal 数据集总览(23 个数据集统计信息,包括 4 个验证数据集)

随后,研究人员又根据组织类型、成像方式以及协议,进一步将 Dreal 划分为了 23 个数据集,并且对每个数据集进行了预处理,最后从图像及其相应的标签中提取目标形状为 128³ 的 patches。

图片

数据示例图

研究人员引入了域随机化策略创建了 Ddrand,如下图所示。该方法通过在真实血管数据上施加一系列的空间变换和人工伪影,生成大量具有多样性的合成图像-掩码对,以此提升模型对真实数据的鲁棒性。具体来说可分为 3 步,即前景生成、背景生成和背景融合。

图片

图 a 为用于生成 Ddrand 的领域随机生成管道的示意图;图 b 为示例图

在前景生成阶段,研究人员利用 Wittmann 等提供的 1,137 个形状为 250³ 的血管板块 v 作为合成掩码的基础,这些血管斑块来自于腐蚀铸型的图形表示,具有高保真性。

研究人员采用的主要方法是通过空间变换,如随机裁剪、翻转、扩张和缩放、随机弹性变形以及二元平滑来实现生成广泛的真实血管模式。接下来,研究人员又通过选择伪影变换,如偏置场、高斯噪声、高斯平滑、dropout、偏移、模糊等来模拟真实血管图像中存在的各种前景伪影。

在背景生成阶段,研究人员对包含不同纹理的各种背景几何形状的背景图像进行了建模,主要包括 3 种变体:球体(非重叠球体)、多面体(使用 Voronoi 将图像分割成多个多面体区域)以及不包含任何背景的几何图像。

在背景融合阶段,研究人员通过体素加减法或用掩模强度值替换背景强度值,将前景合并到背景中。为了扩大图像域,研究人员连续通过随机偏置场增强、添加高斯噪声、在 k 空间中应用随机局部峰值、随机调整图像对比度,对所有空间维度的个体或共享 σ 值执行高斯平滑、添加 Rician 噪声和 Gibbs 噪声、执行随机高斯锐化,并随机变换强度直方图,最终得到合成图像 Xdrand(如上图 b 中所示)。

为了进一步丰富真实数据 Dreal 的分布,研究人员进一步训练并采样了一个基于 Flow Matching 的条件生成模型 F,生成了第三个数据源 Dflow。如下图所示。

图片

3 个数据源 Dreal(蓝色阴影)、Dflow (红色阴影)以及 Ddrand (灰色阴影)分布示意图

模型架构:引入深度生成模型和域随机化策略

总体而言,vesselFM 是一个专门为 3D 血管分割而设计的通用基础模型,能够在各种模式和组织类型中精准分割 3D 血管系统。在模型的设计过程中,研究人员通过 3 个异构数据源对其进行训练,实现了其强大的分割能力和泛化能力。
 

图片

vesselFM 的训练及应用概览

在这一过程,研究人员引入了 2 个关键步骤,分别是深度生成模型和域随机化策略。上文数据集介绍部分详细阐述了域随机化策略,本部分着重介绍生成 Dflow 数据集所使用的深度生成模型。

深度生成模型是合成医学图像生成的重要手段,以扩散模型(Diffusion Model)为主,用于生成大量高保真合成数据。为了将这些数据进行分割任务,需要精确匹配图像-掩码对,比如 Med-DDPM、SegGuidedDiff 等方法,就是为了应对这一挑战而设计。它们通过通道级联分割掩码到模型输入来整合语义条件,从而产生符合一致解剖约束的图像掩码对。前者为 3D 脑成像合成量身定制,后者为 2D 乳腺 MRI 和腹部 CT 生成而设计。

在本研究中,研究人员采用了不同于扩散模型的方法,使用 Flow Matching 的生成模型方法。它通过学习数据从一个已知分布到目标分布的连续变换过程,从而生成新的样本,相比于扩散模型,后者在自然图像上显示出了更卓越的性能。

具体在研究中,生成模型 F 利用一个 θ 参数化的网络,表示一个学习与时间相关的速度场 v,然后通过常微分方程(Ordinary Differential Equation, ODE)将样本 x₀~N(0,I)映射到数据分布的样本 x₁。同时,为了训练模型 F,研究人员还优化了流匹配目标,使预测速度与采样真值速度在时间刻度上的损失最小化。

此外,训练模型 F 还采用了掩码和类别条件,通过将掩码通道与输入图像连接 xₜ 来实现掩码调理。研究人员将类嵌入加入到时间嵌入中来合并类信息,然后通过加法注入到中间特征层中。为了生成 Dflow,研究人员最终通过欧拉积分(Euler integration)对 x₁ 进行离散化,从而对大量图像 Xflow 进行采样,如下图所示。

图片

图 a 为基于 Flow Matching 的采样过程;图 b 为示例图

实验结果:性能优于当前最先进模型

为了验证 vesselFM 的有效性和可靠性,研究人员通过对比的方式进行了评估,并展示了其在零样本、单一样本以及少样本场景下的分割能力。

具体来说,验证阶段采用了 4 个临床数据集:SMILE-UHURA、MSD8、OCTA 和 BvEM。研究人员从这些评估数据集中提取形状为 128³ 的 3 个 patches,并利用其将单一样本和少样本分割任务定义为在其中一个或全部三个数据块上,以便对模型进行微调。其余数据用于测试和验证。对于零样本评估,模型将直接应用测试数据而无需预先微调。

同时将 4 款专门为 3D 血管分割而设计的基础模型作为比较对象,分别为:tUbeNet、VISTA3D、SAM-Med3D 和 MedSAM-2。

研究人员使用单卡 NVIDIA RTX A6000 GPU,从模型 F 中采样了 1 万个图像掩码,在 3 天时间内生成 Dflow。同时为了管理 Ddrand,研究人员从域随机化生成管道中抽取了 50 万个图像掩码对,每个图像掩码对的形状均为 128³。所使用的 3 个数据源权重大致根据其大小来设置,分别为 Ddrand(70%)、Dreal(20%)和 Dflow(10%)。

具体结果如下图所示。vesselFM 在所有 4 个数据集和任务上都展示了卓越的泛化能力和优秀性能。其中零样本任务中,在 MSD8 数据集上,vesselFM 的 Dice 得分比 VISTA3D 高出 5.86 分(VISTA3D 在 11,454 个 CT 数据上进行训练,本身包括来自 MSD8 的数据),这更加凸显了 vesselFM 强大的归纳偏置。

图片

在 4 个验证集上的对比结果

相比之下,通用 3D 血管分割模型 tUbeNet 在更复杂的成像模态中表现并不佳,另外 2 个通用分割模型 SAM-Med3D 和 MedSAM-2 在零样本设置下均无法分割血管。值得一提的是,在 SMILE-UHURA 数据集上,vesselFM 在零样本场景下的 Dice 和 clDice 得分甚至超过了基线模型在少样本场景下的得分。定性结果表明了 vesselFM 在零样本下卓越的泛化能力,且不存在注释者特定的偏差。如下图所示。

图片

部分验证集上的可视化结果

深度学习开启血管分割研究的新道路

综上而言,vesselFM 的相关研究无疑推动了 3D 血管分割研究的进步,为血管类疾病的治疗和研究提供了全新的道路,有望促进新的先进工具诞生和应用,并最终实现造福患者的目标。

而值得庆幸的是,vesselFM 并非一次孤单尝试。随着深度学习技术的发展和医疗数据的日益丰富,通过人工智能的方式处理医学图像已经是现代医疗变革的一个重要方向。越来越多的实验室和研究机构都将注意力放到了这一领域,并希望通过自己的研究来解决人类所面临的血管类疾病挑战。

比如中国科学院的团队曾发表过一篇题为「VesselSAM: Leveraging SAM for Aortic Vessel Segmentation with LoRA and Atrous Attention」的研究。研究提出了一种增强版本的 SAM,命名为 VesselSAM,专门用于主动脉血管分割。该模型集成空洞注意力模块和低秩适应(LoRA),解决了 SAM 的关键局限性,增强了其捕捉医学图像中复杂的层次特征的能力。

论文地址:

https://arxiv.org/abs/2502.18185

来自中国上海交通大学的团队联手上海第一人民医院、贝尔法斯特女王大学和路易斯安娜州立大学等团队,发表题为「Self-Supervised Vessel Segmentation via Adversarial Learning」的研究。该研究提出通过对抗学习来训练 2 个生成器,一个是注意力引导生成器,一个是分割生成器,让它们分别合成假血管、从冠状动脉血管造影图像中分割血管,从而学习血管的特征表示。该论文还入选了 CVPR 2021。

论文地址:

https://openaccess.thecvf.com/content/ICCV2021/papers/Ma_Self-Supervised_Vessel_Segmentation_via_Adversarial_Learning_ICCV_2021_paper.pdf

来自葡萄牙里斯本大学的团队联合葡萄牙天主教大学的团队同样也在血管分割方面发表了相关研究,他们提出了一种基于深度学习开发的 3D 视网膜血管网络自动分割和定量软件 3DVascNet。该软件不仅实现了对血管的精准分割,同时还可以量化血管形态测量参数,如血管密度、分支长度、血管半径和分支点密度等。更重要的是,该软件为一款免费软件,同时其强大泛化能力又进一步促进了医护人员研究三维血管网络的能力。相关研究以「3DVascNet: An Automated Software for Segmentation and Quantification of Mouse Vascular Networks in 3D」为题发表。

论文地址:

https://www.ahajournals.org/doi/10.1161/ATVBAHA.124.320672

总而言之,血管分割作为医学图像处理中一项关键而又兼具挑战性的任务,仍然有诸多难题亟待解决,但科研人员们的一次又一次尝试无疑让我们看到了这些难题正在土崩瓦解。更令人相信的是,在不久的将来,或许血管类疾病将也将会随着人工智能应用的加深,而被逐渐攻克。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/905094.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

git高效杀器——cz-customizable 搭配 commitlint

What is cz-customizable and commitlint? cz-customizable 一款可定制化的Commitizen插件(也可作为独立工具),旨在帮助创建如约定式提交规范的一致性提交消息。commitlint commitlint 是一个用于检查 Git 提交信息的工具,它可以帮助开发者保持提交信息的规范性和一致性。…

Spark 中RDD、Job,stage,task的关系

目录 1. 概念定义1.1 Job1.2 Stage1.3 Task 2. 关系总结3. 示例分析代码示例执行过程 4. Spark中的运行流程5. 关键点5.1 宽依赖和窄依赖5.2 并行度5.3 性能优化 **6. 总结****1. RDD的核心作用****1.1 什么是RDD?****1.2 RDD与Job、Stage、Task的关系** **2. Job、…

Kubernetes基础(三十二):Worker节点启动全解析

Worker节点是Kubernetes集群的"肌肉",负责实际运行业务负载。本文将深入剖析Worker节点的完整启动流程,并揭秘生产环境中的关键优化点。 一、启动流程全景图 二、核心启动阶段详解 1. 系统初始化(0-30秒) 关键任务&a…

matlab实现模型预测控制

考虑扩展状态空间形式 缩写为 对于未来的预测,这里要注意,默认了最小预测时域为1,如果不为1,从k1到k最小预测时域的x的预测为0 模型预测控制matlab运行代码,可实现模型预测控制。 StateMPC是按照钱积新版《预测控制》…

Python_day22

DAY 22 复习日 复习日 仔细回顾一下之前21天的内容,没跟上进度的同学补一下进度。 作业: 自行学习参考如何使用kaggle平台,写下使用注意点,并对下述比赛提交代码 kaggle泰坦里克号人员生还预测 一、Kaggle 基础使用步骤 注册与登录…

【软件测试】基于项目驱动的功能测试报告(持续更新)

目录 一、项目的介绍 1.1 项目背景 二、测试目标 2.1 用户服务模块 2.1.1 用户注册模块 2.1.1.1 测试点 2.1.1.2 边界值分析法(等价类+边界值) 2.1.1.2.1 有效等价类 2.1.1.2.2 无效等价类 2.1.1.2.3 边界值 2.1.1.2.4 测试用例设计 2.1.2 用户登录 2.1.2.1 测试…

QT中多线程的实现

采用官方推荐的 QObject::moveToThread 方式实现(相比继承 QThread 更灵活),包含耗时任务执行、主线程通信、线程安全退出等核心功能。 环境说明 Qt 版本:Qt 5.15 或 Qt 6(兼容)项目类型:GUI …

从知识图谱到精准决策:基于MCP的招投标货物比对溯源系统实践

前言 从最初对人工智能的懵懂认知,到逐渐踏入Prompt工程的世界,我们一路探索,从私有化部署的实际场景,到对DeepSeek技术的全面解读,再逐步深入到NL2SQL、知识图谱构建、RAG知识库设计,以及ChatBI这些高阶应…

maven如何搭建自己的私服(LINUX版)?

环境准备 安装 JDK :确保系统已安装 JDK 8 或更高版本。可以通过以下命令安装 JDK: 安装 OpenJDK :sudo apt update && sudo apt install openjdk-11-jdk 安装 Oracle JDK :需要添加第三方仓库,例如 WebUpd8 …

armv7 backtrace

ref: ARM Cortex-M3/M4/M7 Hardfault异常分析_arm hardfault-CSDN博客

探索 C++23 的 views::cartesian_product

文章目录 一、背景与动机二、基本概念与语法三、使用示例四、特点与优势五、性能与优化六、与 P2374R4 的关系七、编译器支持八、总结 C23 为我们带来了一系列令人兴奋的新特性,其中 views::cartesian_product 是一个非常实用且强大的功能,它允许我们轻…

SHAP分析!Transformer-BiLSTM组合模型SHAP分析,模型可解释不在发愁!

SHAP分析!Transformer-BiLSTM组合模型SHAP分析,模型可解释不在发愁! 目录 SHAP分析!Transformer-BiLSTM组合模型SHAP分析,模型可解释不在发愁!效果一览基本介绍程序设计参考资料 效果一览 基本介绍 基于SH…

牛客周赛 Round 92-题解

牛客周赛 Round 92-题解 A-小红的签到题 code #include<iostream> #include<string> using namespace std; string s; int main() {int n;cin >> n;cout << "a_";for (int i 0; i < n - 2; i )cout << b;return 0; }B-小红的模…

Java设计模式之建造者模式:从入门到精通

1. 建造者模式概述 1.1 定义与核心概念 **建造者模式(Builder Pattern)**是一种创建型设计模式,它将复杂对象的构建过程与其表示分离,使得同样的构建过程可以创建不同的表示。 专业术语解释表: 术语解释产品(Product)最终要构建的复杂对象建造者(Builder)定义创建产品各个…

各类有关NBA数据统计数据集大合集

这些数据我已上传大家在CSDN上直接搜索就可以&#xff01; 一、【2022-2023 NBA球员统计】数据集 关键词: 篮球 描述: 语境 该数据集每场比赛包含2022-2023常规赛NBA球员统计数据。 请注意&#xff0c;由团队更改产生了重复的球员名称。 * [2021-2022 NBA播放器统计]&#…

3、食品包装控制系统 - /自动化与控制组件/food-packaging-control

76个工业组件库示例汇总 食品包装线控制系统 这是一个用于食品包装线控制系统的自定义组件&#xff0c;提供了食品包装生产线的可视化监控与控制界面。组件采用工业风格设计&#xff0c;包含生产流程控制、实时数据监控和逻辑编程三个主要功能区域。 功能特点 工业风格UI设…

NPDP.新产品开发职业认证知识体系NPDP.BOK

第一章 新产品开发战略 1.2 战略及其层级--公司-经营--创新--新产品开发组合-新产品开发项目 “(战略能够)定义与传播一个组织的独特定位&#xff0c;说明应当如何整合组织的资源、技能与能力以获取竞争优势。”(波特&#xff0c;2008) “基于行业定位、机遇和资源,企业为实…

器件(八)—芯片封装中的开尔文源极

首先再次回顾一下MOS到底怎么导通的 在如上的结构中&#xff0c;栅极加压&#xff0c;让N和P-base间形成导电沟道&#xff0c;Vds间加正电压&#xff0c;流到N里的电子依靠这个电压一路飘洋过海&#xff0c;通过Gate给它开辟的沟道&#xff0c;从N到P-base&#xff0c;再从P-ba…

客服系统重构详细计划

# 客服系统重构详细计划 ## 第一阶段&#xff1a;系统分析与准备工作 ### 1. 代码审查和分析 (1-2周) - 全面分析现有代码结构 - 识别代码中的问题和瓶颈 - 理解当前系统的业务逻辑 - 确定可重用的组件 - 制作系统功能清单 ### 2. 技术栈升级准备 (1周) - 升级PHP版本到7…

UNet网络 图像分割模型学习

UNet 由Ronneberger等人于2015年提出&#xff0c;专门针对医学图像分割任务&#xff0c;解决了早期卷积网络在小样本数据下的效率问题和细节丢失难题。 一 核心创新 1.1对称编码器-解码器结构 实现上下文信息与高分辨率细节的双向融合 如图所示&#xff1a;编码器进行了4步&…