详细图解 Path-SAM2: Transfer SAM2 for digital pathology semantic segmentation

在这里插入图片描述

✨ 背景动机

  • 数字病理中的语义分割(semantic segmentation)是非常关键的,比如肿瘤检测、组织分类等。
  • SAM(Segment Anything Model)推动了通用分割的发展,但在病理图像上表现一般。
    病理图像(Pathology Images)指的是通过显微镜观察生物组织切片后拍摄的图像,主要用来帮助医生诊断疾病。
  • SAM2相较于SAM提升了准确率和泛化性,但在病理图像分割上,直接用SAM2还是不够好。
  • 因此,Path-SAM2提出了专门为病理图像设计的SAM2变体。

🛠 方法设计

整体架构如下:
在这里插入图片描述

主要包括:

  • SAM2图像编码器
  • 外部病理编码器UNI
  • 维度对齐模块
  • KAN分类模块(取代传统prompt)
  • 混合解码器

1. Pathology Encoder

  • SAM2自带的Hiera网络是为自然图像设计的,不够理解病理图像细节。
  • 新引入了UNI —— 一个在1亿张H&E病理图上自监督训练的超大模型,专门懂病理。
  • 做法:将SAM2编码器输出UNI编码器输出拼接(concat),作为后续特征输入。

2. KAN分类模块(取代Prompt)

  • 传统SAM需要人工给“点提示”(点在肿瘤位置提示模型),很麻烦。
  • 这里引入了Kolmogorov–Arnold Network(KAN),代替人工prompt,自动生成分类提示。
  • KAN的特点:用可学习的单变量函数,取代传统MLP的线性权重,提升了参数利用率和解释性。

3. Loss设计

  • 总损失 = **Dice Loss + Focal Loss + IOU Loss(MSE)**的加权组合。
  • 参数 α 和 β 控制各部分的比重(文中默认α=0.125,β=0.01)。

📊 实验与结果

数据集

  • EBHI:4,456张 224×224 的切片
  • CRAG:213张 1536×1536 的大图
  • GlaS:165张 522×775 的肠腺癌组织

实验设置

  • 使用SAM2UNI的预训练权重
  • 三层KAN网络
  • 优化器:AdamW
  • 训练硬件:4× RTX V100 GPU

主要结果(见表格)

方法EBHI IOUCRAG IOUGlaS IOU
Fine-tuned SAM250.24%53.17%47.82%
MedSAM2 (pp)62.29%49.72%48.55%
Path-SAM2 (Ours)93.17%89.38%92.02%
  • ➡️ Path-SAM2在三个病理数据集上都大幅领先其他方法。
  • ➡️ 引入UNI病理知识+KAN分类模块的改动起了决定性作用。
  • ➡️ 相比SAM/SAM2,即便人工精细点prompt,Path-SAM2仍明显更好。

Ablation Study(消融实验)

  • 证明了KAN模块比传统MLP更好,带来了显著的IOU提升。

🏁 结论

  • Path-SAM2是首个基于SAM2,且针对病理图像语义分割特别设计的模型。
  • 核心贡献:
    • 结合了UNI病理编码器增强病理领域知识。
    • KAN分类器代替人工prompt,提升了自动化和精度。
  • 在多个病理数据集上验证了出色性能,未来会公开代码和模型权重。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/903205.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

初识Redis · 哨兵机制

目录 前言: 引入哨兵 模拟哨兵机制 配置docker环境 基于docker环境搭建哨兵环境 对比三种配置文件 编排主从节点和sentinel 主从节点 sentinel 模拟哨兵 前言: 在前文我们介绍了Redis的主从复制有一个最大的缺点就是,主节点挂了之…

HTTP header Cookie 和 Set-Cookie

RFC 6265: HTTP State Management Mechanismhttps://www.rfc-editor.org/rfc/rfc6265 Set-Cookie 响应头 服务器使用 Set-Cookie 响应头向客户端&#xff08;通常是浏览器&#xff09;发送 Cookie。 基本格式&#xff1a; Set-Cookie: <cookie名称><cookie值>;…

【Unity完整游戏开发案例】从0做一个太空大战游戏

1.实现飞机移动控制 // 这个脚本实现控制飞机前后移动&#xff0c;方向由鼠标控制 //1.WS控制前后移动2.鼠标控制上下左右旋转3.AD控制倾斜 using System.Collections; using System.Collections.Generic; using UnityEngine;public class PlayerController : MonoBehav…

【C++】C++11新特性(一)

文章目录 列表初始化initializer_list左值引用和右值引用 列表初始化 在 C98 中可以使用{}对数组或者结构体元素进行统一的列表初始值设定 struct Point {int _x;int _y; }; int main() {int array1[] { 1, 2, 3, 4, 5 };int array2[5] { 0 };Point p { 1, 2 };return 0; …

小黑享受思考心流: 73. 矩阵置零

小黑代码 class Solution:def setZeroes(self, matrix: List[List[int]]) -> None:"""Do not return anything, modify matrix in-place instead."""items []m len(matrix)n len(matrix[0])for i in range(m):for j in range(n):if not m…

精益数据分析(19/126):走出数据误区,拥抱创业愿景

精益数据分析&#xff08;19/126&#xff09;&#xff1a;走出数据误区&#xff0c;拥抱创业愿景 在创业与数据分析的探索之旅中&#xff0c;我们都渴望获取更多知识&#xff0c;少走弯路。今天&#xff0c;我依然带着和大家共同进步的想法&#xff0c;深入解读《精益数据分析…

循环神经网络RNN---LSTM

一、 RNN介绍 循环神经网络&#xff08;Recurrent Neural Network&#xff0c;简称 RNN&#xff09;是一种专门用于处理序列数据的神经网络&#xff0c;在自然语言处理、语音识别、时间序列预测等领域有广泛应用。 传统神经网络 无法训练出具有顺序的数据。模型搭建时没有考…

优考试V4.20机构版【附百度网盘链接】

优考试局域网考试系统具有强大的统计分析功能。优考试通过对考试数据进行统计分析&#xff0c;诸如考试分数分布&#xff0c;考试用时分布&#xff0c;错排行等&#xff0c;让你从整体上了解你的学员&#xff08;员工&#xff09;状态&#xff0c; 同时你也可以对学员&#xff…

【Amazing晶焱科技高速 CAN Bus 传输与 TVS/ESD/EOS 保护,将是车用电子的生死关键无标题】

台北国际车用电子展是亚洲地区重量级的车用电子科技盛会&#xff0c;聚焦于 ADAS、电动车动力系统、智慧座舱、人机界面、车联网等领域。各大车厂与 Tier 1 供应链无不摩拳擦掌&#xff0c;推出最新技术与创新解决方案。 而今年&#xff0c;“智慧座舱” 无疑将成为全场焦点&am…

面试:结构体默认是对齐的嘛?如何禁止对齐?

是的。 结构体默认是对齐的‌。结构体对齐是为了优化内存访问速度和减少CPU访问内存时的延迟。结构体对齐的规则如下&#xff1a; 某数据类型的变量存放的地址需要按有效对齐字节剩下的字节数可以被该数据类型所占字节数整除&#xff0c;char可以放在任意位置&#xff0c;int存…

如何优雅地解决AI生成内容粘贴到Word排版混乱的问题?

随着AI工具的广泛应用&#xff0c;越来越多人开始使用AI辅助撰写论文、报告或博客。然而&#xff0c;当我们直接将AI生成的文本复制到Word文档中时&#xff0c;常常会遇到排版混乱、格式异常的问题。这是因为大部分AI输出时默认使用了Markdown格式&#xff0c;而Word对Markdown…

Golang | HashMap实现原理

HashMap是一种基于哈希表实现的键值对存储结构&#xff0c;它通过哈希函数将键映射到数组的索引位置&#xff0c;支持高效的插入、查找和删除操作。其核心原理如下&#xff1a; 哈希函数&#xff1a;将键转换为数组索引。理想情况下&#xff0c;不同键应映射到不同索引&#xf…

vue3学习之防抖和节流

​ 在前端开发中&#xff0c;我们经常会遇到这样的情况&#xff1a;某些事件&#xff08;如滚动、输入、点击等&#xff09;会频繁触发&#xff0c;如果不加以控制&#xff0c;可能会导致性能问题。Vue3 中的防抖&#xff08;Debounce&#xff09;和节流&#xff08;Throttle&a…

4.2.2 MySQL索引原理以及SQL优化

文章目录 4.2.2 MySQL索引原理以及SQL优化1. 索引与约束1. 索引是什么2. 索引的目的3. 几种索引4. 约束1.外键2. 约束 vs 索引的区别 5. 索引实现1. 索引存储2. 页3. B树4. B树层高问题5. 自增id6. 聚集索引7. 辅助索引 8. innnodb体系结构1. buffer pool2. change buffer 9. 最…

【学习笔记】文件包含漏洞--本地远程包含、伪协议、加密编码

一、文件包含漏洞 和SQL等攻击方式一样&#xff0c;文件包含漏洞也是一种注入型漏洞&#xff0c;其本质就是输入一段用户能够控制的脚本或者代码&#xff0c;并让服务端执行。 什么叫包含呢&#xff1f;以PHP为例&#xff0c;我们常常把可重复使用的函数写入到单个文件中&…

蓝桥杯 2021年模拟赛 扫雷问题

题目&#xff1a; 在一个 n 行 m 列的方格图上有一些位置有地雷&#xff0c;另外一些位置为空。 请为每个空位置标一个整数&#xff0c;表示周围八个相邻的方格中有多少个地雷。 输入描述 输入的第一行包含两个整数 n,m。 第 22行到第n1 行每行包含 m 个整数&#xff0c;相…

写windows服务日志-.net4.5.2-定时修改数据库中某些参数

环境&#xff1a; windows 11 Visual Studio 2015 .net 4.5.2 SQL Server 目的&#xff1a; 定时修改数据库中某些参数的值 定时修改24小时内&#xff0c;SQL数据库中&#xff0c;表JD_Reports 内&#xff0c;如果部门是‘体检科&#xff0c;设置打印类型为 1 可以打印。步骤&a…

madvise MADV_FREE对文件页统计的影响及原理

一、背景 madvise系统调用是一个与性能优化强相关的一个系统调用。madvise系统调用包括使用madvise函数&#xff0c;也包含使用posix_fadvise函数。如我们可以使用posix_fadvise传入POSIX_FADV_DONTNEED来清除文件页的page cache以减少内存压力。 这篇博客里&#xff0c;我们…

于键值(KV)的表

基于键值&#xff08;KV&#xff09;的表 将行编码为键值&#xff08;KVs&#xff09; 索引查询&#xff1a;点查询和范围查询 在关系型数据库中&#xff0c;数据被建模为由行和列组成的二维表。用户通过SQL表达他们的意图&#xff0c;而数据库则神奇地提供结果。不那么神奇的…

2025年邵阳市工程技术研究中心申报流程、条件、奖补

一、邵阳市工程技术研究中心申报条件 &#xff08;一&#xff09;工程技术研究中心主要依托科技型企业组建&#xff0c;依托单位应具有以下条件&#xff1a; 1. 具有较强技术创新意识的领导班子和技术水平高、工程化实践经验丰富的工程技术研发队伍&#xff0c;其中固定人员…