白箱、黑箱到灰箱,神经科学迎来新物种:不再复刻大脑,而是成为大脑的AI代言人

来源:集智俱乐部

传统神经科学依赖机制假设构建模型,而人工智能正在引入一种新的研究对象——代理脑(surrogate brain):一种可从数据中学习、可预测、可操纵的个体化全脑动力学系统。与经典生物物理模型不同,代理脑并不试图完整复刻真实神经机制,而是通过解决逆问题,学习最小但足以重现脑动力学的有效计算结构。

其关键突破在于:代理脑首次使大脑从“被解释的系统”转变为“可进行虚拟干预与反事实实验的对象”。借助正向建模、逆问题求解与正则化的统一框架,代理脑正在成为连接数据、机制与干预的中介层,为理论神经科学与神经工程提供一种新的共同语言。

Zhang, Yinuo, et al. "Artificial intelligence as a surrogate brain: Bridging neural dynamical models and data." National Science Review (2025): nwaf457.

预测大脑活动:

从机理驱动到数据驱动的范式转移

理解并预测大脑活动是神经科学的核心目标之一。传统研究主要依赖神经动力学的机制模型,这类正向建模通常受限于固定的方程形式和群体平均参数,难以充分捕捉个体大脑中丰富的非线性和情境依赖动力学。随着机器学习方法的发展以及大规模神经数据的出现,数据驱动的脑动力学建模展现出巨大潜力。循环神经网络和 Transformer 等模型在正向脑建模中取得了领先性能,并推动了以 AI 模型作为“代理脑”的研究范式。

构建代理脑涉及两个相互关联的过程:正向建模,即刻画潜在大脑状态在动力学算子作用下的演化及其到可观测信号的映射;以及逆问题求解,即从数据中学习这些动力学规则,涉及训练策略、目标函数与参数优化的设计。根据在模型结构中整合先验知识程度的不同,代理脑在本综述中被细分为:白盒、黑盒与灰盒模型,下面将展开介绍这三类模型。

图 1. 神经动力系统中的AI代理脑的理论架构。代理脑是通过两个相互关联的过程构建的:正演建模和反求解问题。正向模型描述了潜在的大脑状态如何根据动力学算子F演化,并通过观察映射h产生可被观察到的信号。这里,ut表示外部输入,𝝃t捕获内在动态噪声,𝜼𝑡建模测量不确定性。反问题求解需要从数据中学习到F和h,这包括选择训练策略(例如,下一个令牌预测)、定义目标和优化参数。该框架适配白盒、灰盒和黑盒的F和h公式,使代理脑能够灵活地将机制先验与数据驱动的适应相结合。这些步骤产生了一个个性化的、预测的脑动力学模型,支持机制洞察、虚拟实验和模型引导的神经刺激。

多尺度的白盒模型:

从单神经元到全脑网络

白盒模型的精髓在于其能够整合从神经生物学和物理学中推导出的机制原理,为模拟跨层级的神经动力学提供结构化且可解释的方法。在单神经元层面,经典的霍奇金-赫胥黎模型详细地刻画了进出神经元的离子流,尽管提供了深入的机制,但并不适用大规模神经元群体的模拟。因此,在进行神经网络的大规模模拟时,研究者常采用简化后的泄露积分-发放(Leaky-integrate fire, LIF)模型来平衡简洁性与计算效率。

当到神经群体层面时,白盒模型通过平均场近似(mean-field approximation)将单神经元动力学扩展到宏观变量(如平均膜电位)。神经质量模型(NMMs)作为其中的杰出代表,利用低维且具有生物学解释性的方程描述群体动态,能够模拟如EEG节律、视觉注意力等现象。进一步地,脑网络模型(BNMs)通过整合神经质量模型作为节点动力学,模拟整个大脑网络的相互作用。这些网络模型通常采用邻接矩阵来编码从实测数据中推导出的结构连接。这种从微观到宏观的整合,为理解分布式神经回路如何协调支持复杂认知功能开启了一扇窗。

黑盒模型:

数据驱动的灵活性与表现力

当潜在的生物物理机制难以用显式微分方程表达时,黑盒模型提供了另一种选择。作为通用近似器,人工神经网络理论上可以捕捉任何数据模式,尤其适用于建模大脑活动中特有的非线性和高维过程。过去十年中,RNNs、神经微分方程(Neural ODEs)以及Transformer等模型在模拟动力学系统方面取得了显著成就。

黑盒模型的成功很大程度上取决于模型架构与特定神经信号特征的匹配。例如,针对具有高时间波动特性的EEG信号,可能需要WaveNet等能够捕捉细粒度频率模式的架构;而针对fMRI数据,简单的多层感知器(MLP)就能表现出不错的预测精度。此外,从直接在观察空间建模转向在潜空间(latent spaces)建模,是理解神经动力学的另一个补充视角。认知状态往往存在于比原始数据更低维的子空间中,通过变分自编码器(VAE)等方法学习低维嵌入,可以更有效地揭示复杂动态背后的潜在轨迹。

灰盒模型:

先验知识与数据学习的融合

灰盒模型代表了一种混合建模范式,将神经科学或物理学的先验理论知识与数据驱动学习的灵活性相结合。神经科学先验可以作为引导学习的归纳偏置(inductive biases),塑造模型架构或作为优化过程中的正则化项。

一个典型的例子是受到树突计算(dendritic processing)启发的模型,如dend-PLRNN,它将树突机制整合进循环动力学中,在降低模型维度的同时增强了非线性重建能力。此外,大脑的一些基本组织原则也被纳入模型设计,例如强制神经元遵循戴尔原则(Dale’s principle)——即神经元要么是纯兴奋性的,要么是纯抑制性的,这被证明能稳定动力学并结构化皮层回路的时间表示。物理原理同样为灰盒模型提供了支撑。物理信息神经网络(PINNs)将物理定律直接嵌入损失函数中,使得学习过程受到公认物理动力学的约束,显著提升了参数推断的准确性和长期预测的稳定性。

图 2.三种类型的神经动力学模型:白盒、黑盒、灰盒模型。

求解逆问题:适应性挑战

解决从观测数据推断未知系统的逆问题,主要有两种主流框架:基于贝叶斯定理的概率框架和基于泛函分析的确定性框架。概率框架将待解参数视为随机变量,核心在于获取参数的后验分布。这种方法的优势在于能将领域专家的知识融入先验分布,并量化解的不确定性,自然地契合白盒模型。然而,对于参数缺乏明确机制含义的黑盒模型,贝叶斯推理往往难以锚定有意义的生物学解释。

确定性框架则将参数视为确定实体,通过最小化目标函数来获取参数解,该目标函数由量化模型预测与观察值偏差的数据保真项和引入先验约束的正则化项(regularization term)组成。虽然这种框架缺乏对解不确定性的量化,但由于其无需从分布中采样,计算效率极高,且能很好地适应黑盒和灰盒模型。近年来,两者融合的趋势愈发明显。例如,利用变分推理捕捉潜在变量的不确定性,同时利用确定性神经网络的拟合能力来表征复杂的动力学规则。

由于大脑由无数相互作用的组件组成,其逆问题本质上是一个高维且非线性的优化问题。目标函数极易陷入局部最小值,这意味着不同的初始值可能导致完全不同的解,而这些解都能很好地拟合观测数据。这种解的多义性会导致神经机制解释的歧义,使得基于模型的生理推论变得不可靠。为了确保解的可信度,必须引入“适定性(well-posedness)”作为建模的前提。

在代理脑的逆问题中,通常考虑三个关键标准。首先是存在性(Existence):对于给定观测数据,至少存在一组生物学合理的潜变量能使模型预测匹配观测值。其次是唯一性(Uniqueness):对于特定的系统和数据,应获得唯一的代理脑模型。最后是稳定性(Stability):当观测数据受到自然生理波动干扰时,模型的解仅应发生微小变化。虽然在黑盒模型中,过度参数化的网络可能导致多组等效解,使得唯一性要求不再适用,但我们仍期望其潜空间表示能够保持稳定,这表明模型找到了表征神经动力学的合适嵌入空间。

图 3. 求解逆问题。(a)建模;(b)用正则化来学习。将目标属性的先验作为正则化加入到损失函数中,优化器解决了学习问题。(c)非唯一性的案例。优化算法中的不同初始条件生成类似模型表现的不同解。(d)不稳定性的案例。通过奇异值分解和扰动测试的稳定性分析。

正则化:缓解病态问题的核心策略

鉴于神经动力学的强非线性、多尺度耦合属性以及观测数据固有的噪声,上述适定性条件往往难以满足,导致逆问题表现为“病态(ill-posed)”。正则化理论(Regularization theory)是解决此类问题的关键,其核心思想是通过添加正则化项来引入先验约束,预设参数解或模型行为的特征。这能够窄化解空间,使解符合生理特征并在噪声扰动下保持稳定。

正则化主要通过两种方式发挥作用。一种是数学先验正则化,如稀疏性约束(Sparsity Constraints)促使模型保留关键连接,或能量约束(Energy Constraints)限制参数幅度以防止过拟合。另一种是基于神经科学知识的先验正则化,将解剖结构、生理机制等编码进正则化项。例如,整合从DTI推导出的结构先验,确保潜表征与大脑的物理结构对齐。虽然这些策略只是缓解病态问题而非彻底消除,但工程实践证明,当正则化策略与问题特征深度结合时,能显著提高逆问题的解的可信度。

双重视角下的评估:

数学精确与生物一致

训练完成后,评估模型是否捕捉到了神经系统的核心动力学,以及是否提供了可解释的表征,是至关重要的一步,通常有数学和神经科学两个互补的视角。数学视角侧重于数据相似性的评估。常用的有点对点误差(如均方误差 MSE),以及分析数据分布全局属性的概率方法(如KL散度或Wasserstein距离)。此外,由于大脑被认为运行在“混沌边缘”,衡量系统对初始条件敏感性的最大李雅普诺夫指数,以及反映吸引子几何复杂性的分形维度,是验证模型是否复制了大脑关键动力学特征的重要指标。

神经科学视角则关注功能的一致性。评估框架会考虑时空激活模式的相似度、光谱相似度以及功能连接的相似性。在实际应用中,代理脑还需要通过任务特定的指标进行验证。例如,在癫痫定位中,通过比较模型预测的癫痫灶与临床切除区域的重合度来评估准确性。这种数学忠实度与神经科学实用性的双重评估,为完善代理脑模型提供了坚实基础。

图 4. 从数学和神经科学的视角进行模型评估。(a-c)数学视角。通过随机Jansen-Rit模型生成合成数据。上下两行对应于来自同一底层系统的两个代理大脑,在三个表征空间中进行评估:(a)状态空间轨迹(均方根误差,RMSE);(b)概率分布(平均Kullback-Leibler散度);(c)相空间动力学(相对相关维数)。代理脑1实现了较低的RMSE,而代理脑2在概率和拓扑度量方面表现更好。(d-h)神经科学观点。指标包括(d)时空相似性,(e)谱相似性,(f) FC相似性,(g)行为解码准确性,(h)预测病变结果的临床疗效。d和e侧重于替代大脑复制生物信号特征的能力,g和h评估其支持下游任务的能力。黄色表示真实的大脑数据;黑色表示代理脑的输出。

应用前景:

模拟平台与精准干预

代理脑作为一个能够产生类脑动力学和生理行为的神经动力学系统,为基础研究和临床转化提供了广阔机遇。代理脑可以作为强大的模拟平台,进行传统湿实验中受限于成本、伦理或技术难度的“假如(what if)”反事实测试。一个典型的应用是“虚拟癫痫患者(Virtual Epileptic Patient)”,这是一个个性化的全脑模拟平台,能够预测手术干预结果并优化方案,其表现潜力已显示出超越传统基于经验规划的趋势。

在神经刺激领域,代理脑正成为闭环神经刺激(closed-loop neurostimulation)的重要指南,协助解决“在哪里刺激、何时刺激、如何刺激”这三个核心问题。基于个体的功能脑网络,代理脑可以帮助识别最可能对刺激产生反应的区域。同时,模型可以实时监测特定的频率模式或低维表征,作为触发神经刺激的生物标志物,确保干预的及时性和有效性。

图 5. 代理脑的应用。(a)脑系统分析。代理允许直接检查基本系统属性,包括相位勘探、神经流形几何和网络动力学剖面。(b)代理作为仿真平台。作为一个硅测试平台,它支持神经动力学预测、虚拟手术(例如,定位癫痫灶以帮助临床计划)和反事实实验,如干扰连接权重或兴奋抑制比,以探测它们的功能角色。(c)替代引导神经刺激。对于非侵入性刺激(如TMS,tES)和侵入性刺激(如DBS,SEEG),代理脑有助于确定刺激的位置,何时靶向以及如何优化刺激参数。

未来展望:挑战与伦理

尽管前景光明,代理脑的发展仍面临多重挑战。首先是多尺度神经数据的整合,如何将微观的脉冲序列与宏观的fMRI信号在保持机制忠实度的前提下对齐,仍是一个未决的问题。其次是模型结构中表达能力与可解释性的平衡:过度表达的模型可能导致生物学上的黑盒化,而过度约束的模型可能无法捕捉大脑的复杂性。

此外,从通用模型向个体化模型的演进是实现精准医学的关键。最后,伦理考量不容忽视。由于代理脑依赖敏感的神经和临床数据,必须建立严格的数据安全框架和治理结构,并警惕训练数据中可能存在的偏见,以确保模型应用的公平性和透明度。随着跨学科协作的深入,代理脑模型将不仅加深我们对大脑动力学的理解,还将通过精准医疗变革神经系统疾病的诊疗。

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1125766.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

吐血推荐专科生必用TOP10 AI论文软件

吐血推荐专科生必用TOP10 AI论文软件 推荐2:「Grammarly」(学术版)——英文论文润色标杆(推荐指数:★★★★☆) 对于有SCI、EI投稿需求的用户,Grammarly(学术版)是不可替…

本章节我们将讨论如何React 表单与事件

React 表单与事件 本章节我们将讨论如何在 React 中使用表单。 HTML 表单元素与 React 中的其他 DOM 元素有所不同,因为表单元素生来就保留一些内部状态。 在 HTML 当中&#xff0c;像 <input>, <textarea>, 和 <select> 这类表单元素会维持自身状态&…

本章节我们将讨论如何React 表单与事件

React 表单与事件 本章节我们将讨论如何在 React 中使用表单。 HTML 表单元素与 React 中的其他 DOM 元素有所不同,因为表单元素生来就保留一些内部状态。 在 HTML 当中&#xff0c;像 <input>, <textarea>, 和 <select> 这类表单元素会维持自身状态&…

Nordic方案——无线射频模组AS01-ML01SC

Nordic Semiconductor在无线性能和精密度方面拥有领先业界的表现&#xff0c;即使是对成本极为敏感的消费类产品&#xff0c;也能运用该公司的超低功耗 (ULP) 无线芯片。Nordic Semiconductor的芯片广泛用于无线PC外设、游戏控制器、体育和健身传感器、玩具、先进的多媒体控制器…

GEO服务/运营商推荐!2026 GEO 优化实用指南:如何选对服务商让 AI 精准推广品牌

随着 QuestMobile 2025 年调研数据显示 AI 搜索引擎月活用户已达 6.85 亿&#xff0c;40 岁以下高学历群体占比超 74%&#xff0c;“让 AI 推广我的品牌” 成为企业数字化营销的核心诉求。而 GEO&#xff08;生成式引擎优化&#xff09;作为抢占 AI 搜索流量的关键技术&#xf…

别再用手机自带天气了

天气应用的技术革命&#xff1a;从数据接收到智能预警的全链路解密当我第一次打开 Mercury Weather 3.0 的飓风追踪界面时&#xff0c;眼前出现的不仅仅是简单的气象图标&#xff0c;而是一个完整的气象数据可视化系统。这让我不禁思考&#xff1a;在看似简单的天气应用背后&am…

Python斐波那契数列代码示例

生成代码示例以下是一个Python代码示例&#xff0c;用于计算斐波那契数列的前n项&#xff1a;def fibonacci(n):fib_sequence []a, b 0, 1for _ in range(n):fib_sequence.append(a)a, b b, a breturn fib_sequencen int(input("请输入要计算的斐波那契数列项数: &qu…

Python斐波那契数列代码示例

生成代码示例以下是一个Python代码示例&#xff0c;用于计算斐波那契数列的前n项&#xff1a;def fibonacci(n):fib_sequence []a, b 0, 1for _ in range(n):fib_sequence.append(a)a, b b, a breturn fib_sequencen int(input("请输入要计算的斐波那契数列项数: &qu…

喜报 | 和鲸智学智研一体机入选《2025 爱分析 · Agent 厂商全景报告》

高校AI教育和能力建设普遍面临三重挑战&#xff1a;学生&#xff0c;尤其是无编程基础者困于技术门槛&#xff0c;难以专注探索和创新&#xff1b;拼凑式采购导致运维成本高、软硬件供应商权责不清&#xff1b;算力资源分散孤立&#xff0c;制约校级协同与长远布局。 在此情境下…

Mac隐藏效率神器

每当深夜敲代码时&#xff0c;我最怕的不是bug难解&#xff0c;而是思路被突如其来的操作打断。想象这样一个场景&#xff1a;你在IDE里调试得正投入&#xff0c;突然需要执行一个本地测试脚本。本能反应是切到终端、定位目录、输入命令——这一套操作下来&#xff0c;刚才清晰…

Python实现斐波那契数列计算

Python 代码示例&#xff1a;计算斐波那契数列def fibonacci(n):"""计算斐波那契数列的第n项:param n: 正整数:return: 第n项的值"""if n < 0:return "输入必须为正整数"elif n 1:return 0elif n 2:return 1else:a, b 0, 1for _…

优质正版素材平台实战指南:四大资源库深度解析

在数字创作领域&#xff0c;优质素材是作品成功的基石&#xff0c;而正版授权则是专业创作的底线。面对市场上众多的素材平台&#xff0c;如何根据项目需求精准选择&#xff1f;本文将深入解析四个具有代表性的正版素材平台——国内领先的制片帮与国际知名的Shutterstock、Pond…

智能体推理范式: ReAct(Reasoning Acting)

什么是 ReAct ReAct Reasoning&#xff08;推理&#xff09; Acting&#xff08;行动&#xff09; 这是一种让大语言模型能够交替进行推理和行动的架构模式&#xff0c;通过与外部工具交互来解决复杂问题。 人类类比 想象你在做饭&#xff1a;这就是 ReAct 的本质&#xff1a;…

全网最全研究生AI论文工具TOP10测评

全网最全研究生AI论文工具TOP10测评 推荐2&#xff1a;「Grammarly」&#xff08;学术版&#xff09;——英文论文润色标杆&#xff08;推荐指数&#xff1a;★★★★☆&#xff09; 对于有SCI、EI投稿需求的用户&#xff0c;Grammarly&#xff08;学术版&#xff09;是不可替代…

Python代码示例:快速筛选偶数并求均值

请提供具体的编程语言和代码功能要求&#xff0c;以便生成符合需求的代码示例。例如&#xff1a;编程语言&#xff1a;Python代码要求&#xff1a;实现快速排序算法或编程语言&#xff1a;JavaScript代码要求&#xff1a;从API获取数据并解析JSON提供详细信息后&#xff0c;将生…

商联达AI智能体:零售业从经验到数据的革命

在数字经济浪潮的席卷下&#xff0c;零售业正经历一场从“经验驱动”到“数据驱动”的深刻变革。在这场变革中&#xff0c;商联达AI智能体凭借其独特的“感知-决策-执行-学习”闭环能力&#xff0c;通过多源数据融合分析与行业场景深度适配&#xff0c;为零售企业构建了从需求洞…

企业选型智能体的五大核心维度:以商联达为例的实战指南

在数字化转型浪潮中&#xff0c;AI智能体已成为企业提升竞争力的"秘密武器"。面对市场上琳琅满目的解决方案&#xff0c;企业如何避免"踩坑"&#xff1f;本文以商联达为例&#xff0c;拆解AI选型的五大核心维度&#xff0c;助您找到最适合的智能伙伴。一、…

程序猿之开发工具Snipaste

Snipaste 是一款功能强大、轻量且免费的截图与贴图工具&#xff0c;其核心设计理念是通过“截图&#xff08;Snip&#xff09; 贴图&#xff08;Paste&#xff09;”来提升电脑用户的工作效率。它不仅仅是一个截图工具&#xff0c;更是一个能将截取或复制的图片、文字、颜色等信…

30秒掌握Python快速排序

为了生成符合要求的代码&#xff0c;需要明确以下信息&#xff1a;编程语言请指定具体的编程语言&#xff08;如 Python、Java、JavaScript、C 等&#xff09;。代码功能请详细描述代码需要实现的功能或逻辑&#xff08;例如&#xff1a;计算斐波那契数列、排序数组、处理文件等…

30秒掌握Python快速排序

为了生成符合要求的代码&#xff0c;需要明确以下信息&#xff1a;编程语言请指定具体的编程语言&#xff08;如 Python、Java、JavaScript、C 等&#xff09;。代码功能请详细描述代码需要实现的功能或逻辑&#xff08;例如&#xff1a;计算斐波那契数列、排序数组、处理文件等…