【文献分享】TransBrain:一种用于在人类与小鼠之间转换全脑表型的计算框架

文章目录

    • 介绍
    • 代码
        • **阶段一:空间转录组匹配 — 建立跨物种分子坐标**
        • **阶段二:图嵌入构建 — 融合多模态进化约束**
        • **阶段三:双向映射 — 实现全脑表型翻译**
    • 参考

介绍

利用人类和动物模型进行的研究构成了精神病学和认知神经科学的基石。人类研究能够直接深入了解大脑的功能和行为,反映现实世界的多样性和临床相关性1。动物模型,尤其是小鼠模型,能够借助先进的基因工具和神经回路操控进行精确的机制探索,提供在人类研究中往往难以获得的因果性见解2。跨物种研究对于将基础发现与转化应用联系起来至关重要。
全脑成像技术的进步为将人类和小鼠的研究结果进行整合创造了机会。然而,人类和小鼠在进化上的差异,尤其是在大脑皮层区域的差异,给跨物种整合带来了巨大的挑战。这种差距使得这两个研究领域基本上处于脱节状态,限制了临床前转化。例如,涉及大脑网络异常的疾病,如自闭症或抑郁症,在人类中表现为不同的生物类型,具有不同的功能障碍模式3,4。虽然存在多种针对这些情况的小鼠模型5,6,7,但目前的方法难以将特定的小鼠模型与相应的临床生物类型相匹配,这限制了对最佳治疗机制的识别以及模型有效性的提升。
已有多种方法对人类与小鼠的同源性进行了研究,其中在进化上保守的区域(如皮层下核团)的研究成果更为显著8、9。传统方法依赖于根据解剖学定义的感兴趣区域(ROI),揭示了静息态组织、基因效应和性别差异方面的同源模式10、11、12。然而,这种方法受到同源区域主观选择的限制,导致不同研究之间存在不一致性。此外,还存在一些其他挑战,包括不一致的解剖学覆盖范围(通常仅分析不到十个到几十个区域)以及复杂的跨物种对应关系,即一个物种的脑区可能映射到另一个物种的多个区域。全脑空间转录组学(WBST)提供了一种更客观的替代方法。基于WBST的跨物种比较方法利用不同物种的同源基因作为共同的分子坐标系统,以量化脑区之间的转录相似性13。与传统方法不同,后者需要对可能的同源区域进行主观预先筛选,而 WBST 则能客观地同时量化所有大脑区域的转录关系,其假设是进化相关的区域会保留相似的分子特征14。这种基于数据的方法消除了选择偏差,并能够检测到保守转录指纹的分级相似性,而非假设严格的一对一对应关系。一项开创性的研究代表了对全脑表型进行定量比较的唯一尝试,它基于约 3000 个同源基因的转录相似性来描述全脑协同激活模式(CAPs)的同源性14。另一项研究使用基于小鼠原位杂交数据的监督式深度神经网络训练,以获得用于研究人类和小鼠之间同源性和进化关系的潜在嵌入13。最近,一种自监督学习方法已被开发出来,用于构建专门针对两种物种的空间转录组数据的全脑对齐方法16。然而,这些方法在皮质区域的分辨率表现不佳,因为在皮质区域,转录组学和细胞异质性相对低于皮质下区域17、18,这使得这些方法主要能够捕捉皮质下区域特有的特征。此外,纯粹的解剖学或转录组学方法忽略了结构连接性,而这种连接性直接制约着功能活动,并提供了至关重要的同源性见解,这一点在人类与猕猴的比较研究中已得到证实19、20、21。
为应对这些挑战,我们开发了 TransBrain,这是一种用于实现人类与小鼠之间定量全脑映射的综合框架(扩展数据图 1a)。TransBrain 包含三个核心步骤(扩展数据图 1b):空间转录组匹配、基于图的随机游走和映射。在空间转录组匹配阶段,我们采用了两种优化策略来提高同源性映射的准确性,特别是对于皮质区域。首先,我们整合了互补的人类转录组数据,包括空间分辨率的微阵列数据22 和大规模单核 RNA 测序(snRNA-seq)数据18,以增加训练样本量。其次,鉴于皮质区域和皮质下区域的转录组特征存在差异,以及人类皮质区域具有更高的功能分化,我们在整合的人类转录组数据上训练了一个分离的深度神经网络模型,以学习区域特异性的潜在嵌入,这些嵌入可推广到小鼠身上。在随机游走阶段,我们构建了一个异质性网络。

代码

https://github.com/ibpshangzheng/transbrain

阶段一:空间转录组匹配 — 建立跨物种分子坐标

目标:超越主观的解剖对应,建立一个基于基因表达的、数据驱动的跨物种脑区相似性度量。

详细过程:

  1. 数据整合与增强:
    • 输入数据:融合两种互补的人类转录组数据。
      • Allen 人类脑图谱(AHBA):高空间分辨率(3,702个样本点),但样本量有限,覆盖全脑。
      • 单核RNA测序数据(snRNA-seq):海量细胞级数据(数百万细胞),但空间分辨率粗(仅标注到大脑叶级区域)。
    • 整合方法:通过筛选空间表达模式一致的基因,并根据解剖距离和区域对应关系进行加权合并,生成了一个兼具高空间分辨率和大样本量的增强型人类转录组数据集。这一步解决了单一数据集覆盖不足的问题,为后续模型训练提供了高质量输入。
  2. 区域特异性嵌入学习(核心创新):
    • 问题:人类皮层在细胞类型和功能分化上远比小鼠复杂,使用单一模型处理全脑会模糊皮层特异性信号。
    • 解决方案:采用“分离式深度神经网络”(Detached DNN)
      • 两个独立模块:一个专门训练于皮层区域数据,另一个专门训练于皮层下区域数据。
      • 训练目标:模型以脑区标签(如“前额叶皮层”、“海马体”)为监督信号,学习将高维基因表达谱压缩为低维(500维)的**“嵌入向量”**。这个向量捕捉了每个脑区独特的转录特征。
    • 效果验证:与使用全脑共享模型的传统方法相比,分离式模型在独立测试集上对皮层和皮层下区域的分类准确率显著更高,且其生成的嵌入向量更能反映解剖层次结构(如同脑叶内区域更相似),显示出更强的区域特异性。
  3. 跨物种转录相似性矩阵构建:
    • 将训练好的人类分离式DNN模型,直接应用于小鼠全脑空间转录组数据,为每个小鼠脑区也计算出一个嵌入向量。
    • 计算所有人类脑区嵌入向量所有小鼠脑区嵌入向量之间的相似性(如余弦相似度),形成一个庞大的“跨物种转录相似性矩阵”。这个矩阵客观地量化了任意人-鼠脑区在分子表达模式上的亲近程度。
阶段二:图嵌入构建 — 融合多模态进化约束

目标:仅靠基因表达不足以完全定义脑区功能与同源性。本阶段将结构连接解剖层次这两个关键的进化约束整合进来。

详细过程:

  1. 构建跨物种异构图:
    • 节点:包含所有人类脑区(127个)和小鼠脑区(68个)。
    • 连边与权重:
      • 物种内连边:基于结构连接数据。人类使用扩散磁共振成像纤维束追踪获得的连接强度;小鼠使用病毒示踪实验获得的“金标准”连接数据。连接强度被归一化并取对数,作为边权重。
      • 物种间连边:基于第一阶段得到的转录相似性矩阵。但为了符合生物学合理性,施加了解剖层次约束:只允许在进化上相关的大类之间(如“人类前额叶皮层”与“小鼠前额叶相关区域”)建立连边,并修剪掉明显不合理的连接(如将小鼠视觉皮层与人类嗅觉皮层强连接)。转录相似性分数作为这些跨物种边的权重。
  2. 图表示学习(Node2vec随机游走):
    • 在图上游走,生成节点序列。游走策略(通过参数pq控制)倾向于在局部(高转录相似性区域)和全局(遵循连接路径)之间取得平衡,确保捕获的信息既有分子保守性,又有网络拓扑结构。
    • 通过算法学习,为图中每个节点(即每个脑区)生成一个新的“图嵌入向量”。这个向量不仅编码了原始的转录相似性,还融入了该脑区在各自物种内的连接模式(谁是邻居)以及它在跨物种层次结构中的位置
  3. 验证整合效果:
    • 分析表明,图嵌入重构的自相关矩阵,比单纯基于转录的嵌入,与真实的物种内结构连接矩阵相关性更高(人类从0.32提升到0.59,小鼠从0.42提升到0.63)。
    • 这说明图嵌入成功地将连接性信息编码了进去。同时,图嵌入与原始转录嵌入在识别经典同源脑区上表现一致,说明没有丢失核心的分子对应信息。
阶段三:双向映射 — 实现全脑表型翻译

目标:利用第二阶段构建的统一、信息丰富的嵌入空间,实现任意全脑模式(如fMRI激活图、结构体积差异)在人与鼠之间的定量转换。

详细过程:

  1. 双重回归映射算法:
    • 映射方向(鼠 → 人):
      • 步骤1:小鼠的某个全脑表型数据(例如,68个脑区的光遗传激活强度)作为因变量,将小鼠的图嵌入矩阵作为自变量,进行回归分析。得到一组回归系数(β),这组系数可以理解为该表型模式在“跨物种通用脑区特征空间”中的坐标。
      • 步骤2:将这组回归系数(β)与人类的图嵌入矩阵相乘。这个操作相当于将“通用空间”中的坐标,用人类的脑区特征基向量重新表达出来,从而生成一个预测的、虚拟的人类全脑表型图(例如,预测的人类脑区激活强度)。
    • 映射方向(人 → 鼠):过程完全对称,以人类表型和人类嵌入开始,最终预测小鼠表型。
  2. 应用案例展示(如Extended Data Fig. 1c所示):
    • a) 功能网络同源性比较:将小鼠静息态fMRI计算出的功能梯度、共激活模式等,映射到人类空间,与人类对应的网络进行定量相关性分析,从而评估哪些功能组织特征是跨物种保守的。
    • b) 光遗传环路功能注释:将小鼠岛叶或背缝核光遗传刺激引发的全脑fMRI激活图,映射为“虚拟人脑激活图”。然后将此图与Neurosynth数据库中成千上万篇人类任务fMRI研究得到的元分析图谱进行关联,从而为小鼠的特定神经环路功能提供可能的人类行为认知解释(如“决策”、“情绪调节”)。
    • c) 疾病模型机制链接:计算自闭症基因敲除小鼠相对于对照组的脑结构体积差异图(Cohen‘s d),将其映射为“虚拟人脑结构变异模式”。在自闭症患者中,建立个体化的脑结构偏差图。通过计算每个患者的偏差图与各种小鼠模型预测的变异模式之间的相似性,可以为患者打分,量化其与特定遗传机制(如Magel2缺失)的匹配程度,从而实现从模型到临床异质性的定量关联。

参考

  • TransBrain: a computational framework for translating brain-wide phenotypes between humans and mice
  • https://github.com/ibpshangzheng/transbrain

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1122869.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

云端AI实验室:免配置玩转中文万物识别模型

云端AI实验室:免配置玩转中文万物识别模型 作为一名中学信息技术老师,我经常想在课堂上演示AI识别技术,但学校机房的电脑配置实在太低,根本无法运行现代AI模型。直到我发现"云端AI实验室:免配置玩转中文万物识别模…

实验室教学管理|基于springboot 实验室教学管理系统(源码+数据库+文档)

实验室教学管理 目录 基于springboot vue美食分享系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue实验室教学管理系统 一、前言 博主介绍&…

基于java+ vue煤矿信息管理系统(源码+数据库+文档)

煤矿信息管理系统 目录 基于springboot vue煤矿信息管理系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue煤矿信息管理系统 一、前言 博主介绍&…

Proteus汉化工具在实验课中的实战案例分析

让工具为人服务:Proteus汉化在电子实验教学中的真实落地实践你有没有见过这样的场景?一节《单片机原理》实验课刚开始十分钟,教室里已经此起彼伏响起“老师,这个‘Place Component’是干啥的?”“Power和Ground有啥区别…

多路红外传感模块应用:Arduino循迹小车项目应用

从零打造一辆会“看路”的小车:多路红外与Arduino的实战解析你有没有想过,一个几十块钱的开源板子加上几块红外传感器,真能让一台小车自己沿着黑线跑起来?这听起来像是机器人竞赛里的高阶操作,但其实,它正是…

基于java+ vue宠物美容机构管理系统(源码+数据库+文档)

宠物美容机构管理 目录 基于springboot vue宠物美容机构管理系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue宠物美容机构管理系统 一、前言 博…

使用ms-swift配置清华镜像加快pip install速度

使用 ms-swift 配置清华镜像加速 pip 安装:打造高效 AI 开发环境 在大模型研发的日常中,你是否经历过这样的场景?刚克隆完一个项目仓库,满怀期待地运行 pip install -r requirements.txt,结果终端卡在“Collecting…”…

超详细版:circuit simulator从原理图到PCB的闭环验证

从原理图到PCB:用电路仿真打造“一次成功”的设计闭环你有没有经历过这样的场景?项目进度卡在最后一块板子上,样机焊好后一通电——输出电压不稳、开关节点振铃严重、反馈信号被干扰得乱跳。示波器探头一放,满屏都是高频噪声。改版…

Salesforce数据治理:Qwen3Guard-Gen-8B扫描联系人备注字段

Salesforce数据治理:Qwen3Guard-Gen-8B扫描联系人备注字段 在一家跨国金融企业的CRM系统中,一位销售代表在“联系人备注”栏写下了一句看似平常的评价:“这位客户情绪不稳定,沟通像泼妇闹事。”几个月后,该企业基于CRM…

VSCode模型可见性切换全解析(专业级配置方案曝光)

第一章:VSCode模型可见性切换全解析在现代软件开发中,Visual Studio Code(VSCode)作为主流代码编辑器,其高度可定制化的界面与功能极大提升了开发效率。其中,模型(Model)的可见性切换…

火锅文化网站|基于springboot 火锅文化网站系统(源码+数据库+文档)

火锅文化网站 目录 基于springboot vue美食分享系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue火锅文化网站系统 一、前言 博主介绍&#xff…

使用ms-swift构建Web API网关统一访问多个模型实例

使用 ms-swift 构建 Web API 网关统一访问多个模型实例 在大模型落地进入“多任务、多模态、多部署形态”并行的时代,企业面临的核心挑战早已不再是“有没有模型”,而是“如何高效地管理几十甚至上百个异构模型”。从客服对话到图文理解,从文…

Qwen3Guard-Gen-8B支持流式输入吗?目前适用于整段文本分析

Qwen3Guard-Gen-8B 支持流式输入吗?答案是:不支持,它专为整段文本分析而生 在大模型应用如火如荼的今天,内容安全早已不再是“加个关键词过滤”就能应付的事。从智能客服到生成式写作平台,从教育工具到政务系统&#x…

万物识别模型对比:如何用云端GPU快速测试多个中文模型

万物识别模型对比:如何用云端GPU快速测试多个中文模型 作为一名AI产品经理,我经常需要评估不同识别模型在业务场景中的表现。手动部署每个模型不仅耗时耗力,还需要处理复杂的依赖关系和显存分配问题。本文将分享如何利用云端GPU环境快速测试多…

Proteus示波器使用方法新手必看入门篇

Proteus示波器使用全攻略:从零开始看懂每一个波形你有没有过这样的经历?辛辛苦苦画好了一个555定时器电路,想看看输出的方波频率对不对,结果发现LED闪得太快根本数不清。或者写了一段单片机PWM程序,心里没底——这占空…

教程视频制作指南:帮助新手快速上手机器学习框架

ms-swift:重塑大模型工程化的新范式 在今天的AI开发现场,一个常见的场景是:团队拿到一个新的大语言模型,兴奋地准备微调上线,结果却被一堆环境依赖、显存不足、训练脚本不兼容的问题卡住。更糟的是,等终于跑…

家政服务管理系统|基于springboot 家政服务管理系统(源码+数据库+文档)

家政服务管理 目录 基于springboot vue家政服务管理系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue家政服务管理系统 一、前言 博主介绍&…

通过git commit message规范提交代码变更记录

通过规范的 Git 提交信息提升工程协作效率 在一次深夜调试中,团队成员小李面对一个突然出现的多模态推理内存泄漏问题束手无策。他尝试使用 git bisect 定位变更点,却在一堆类似“fix something”、“update code”的提交记录中迷失方向。最终花费了整整…

Keil代码提示快捷键配合使用:新手实用技巧

Keil 免提编码实战:用好代码提示和快捷键,效率翻倍不是梦你有没有过这样的经历?写 STM32 的HAL_TIM_PWM_Start函数时,记不清第二个参数是TIM_CHANNEL_1还是TIM_CH1;配置 ADC 结构体时,反复翻头文件确认.Ini…

InternVL3.5特征提取能力分析:适用于哪些下游任务?

InternVL3.5特征提取能力分析:适用于哪些下游任务? 在多模态智能系统日益渗透到搜索、推荐、内容理解等核心场景的今天,一个关键问题浮出水面:我们是否还需要为图像和文本分别构建独立的特征编码器?答案正在变得清晰—…