最适合科研工作的模型是什么?Anthropic:斯坦福、MIT用Claude加速科研进程

来源:ScienceAI 本文约2500字,建议阅读5分钟与学术界及产业界研究人员密切合作,致力于精准把握科学家如何运用人工智能加速科研进程。

去年十月,Anthropic 推出了 Claude 生命科学版 ——Claude for Life Sciences,旨在让 Claude 成为生命科学领域工作者更得力的合作伙伴。

之后,Anthropic 投入大量资源,致力于将 Claude 打造为最适合科研工作的模型。最新推出的 Claude Opus 4.5 在图表解析、计算生物学和蛋白质理解等基准测试中均取得显著进步。

研究人员已开发出定制化系统,将 Claude 的应用场景拓展到文献综述或代码辅助等基础任务之外。简而言之,Claude 正在重塑科学家的研究模式,推动科研领域迈向全新的科学洞察与发现。

Anthropic 最近列举了一些知名实验室采用 Claude 加速科研进程的例子。

Biomni:集成数百种工具与数据库的通用生物医学智能体

生物学研究的一大瓶颈在于工具碎片化:现有数百个数据库、软件包和实验方案,研究人员需要耗费大量时间在不同平台间进行选择和掌握。在理想情况下,这些时间本应用于实验操作、数据解析或探索新课题。

斯坦福大学研发的智能 AI 平台 Biomni,将数百种工具、软件包和数据集整合进统一系统,由 Claude 驱动的智能体可在其中自主调度。研究人员使用自然语言提出需求,Biomni 会自动匹配合适资源。该系统能够提出假设、设计实验方案,并在超过 25 个生物学子领域执行分析任务。

以全基因组关联分析(GWAS)为例,这种研究旨在寻找与特定性状或疾病相关的基因变异。

基因组扫描相对简单,耗时环节在于数据解析与意义解读:基因组数据格式杂乱需要深度清洗;研究人员必须控制混杂因素并处理缺失数据;发现「命中信号」后,还需解析其生物学意义 —— 定位邻近基因、确定其表达细胞类型、推测影响的生物通路等。每个步骤都可能涉及不同工具、不同文件格式和大量人工决策。这种繁琐过程使得单次 GWAS 分析常需数月时间,而在 Biomni 的初期试验中,仅需 20 分钟。

Biomni 团队已通过多领域案例验证系统可靠性:在分子克隆实验设计中,盲评显示其方案与拥有五年以上经验的博士后水平相当;处理 30 名受试者超过 450 份可穿戴设备数据仅用 35 分钟,而专家完成相同任务预计需三周;分析 33.6 万个人类胚胎组织单细胞基因活性数据时,系统不仅验证了已知调控关系,更发现了研究人员未曾关联到胚胎发育过程的新转录因子。

Biomni 并非完美系统,因此设置了防护机制以监测 Claude 是否偏离正轨。它也不能解决所有问题,但当其能力不足时,专家可将方法论编码为技能 —— 教智能体模仿专家解决问题的思路而非任其自由发挥。

Biomni 代表了一种通用型解决方案,而其他实验室正在构建更专精的系统,以攻克特定研究流程中的瓶颈。

Cheeseman 实验室:大规模基因敲除实验解读自动化

当科学家需要了解基因功能时,常用方法是将其从细胞或生物体中移除并观察产生的异常。CRISPR 基因编辑技术使大规模精准敲除成为可能,但其应用仍受限制:实验室产生的数据量远超分析处理能力。

这正是麻省理工学院 Whitehead 研究所 Iain Cheeseman 实验室面临的挑战。他们使用 CRISPR 技术对数千万人类细胞进行数千种基因敲除,通过显微成像记录每个细胞的变化。

但解读基因簇的意义 —— 探究聚类原因、寻找共同特征、判断属于已知生物学关系还是新发现 —— 仍然需要专家逐基因查阅文献。这个过程极其缓慢:单次筛选可能产生数百个基因簇,由于时间、精力和专业知识限制,大多数簇从未被深入探究。

多年来 Cheeseman 亲自承担所有解读工作。他估计自己大约能记住 5000 个基因功能,但有效分析这些数据仍需数百小时。为加速这一进程,博士生 Matteo Di Bernardo 着手构建能自动化 Cheeseman 工作模式的系统。通过深入解析 Cheeseman 的解读方法论 —— 数据源选择、模式识别标准、发现价值判断 —— 他们最终创建了由 Claude 驱动的 MozzareLLM 系统。

该系统接收基因簇数据后,会执行 Cheeseman 式的专家分析:识别潜在共享生物过程、标注研究充分与欠缺的基因、突出值得跟进的目标。这不仅极大加速了研究进程,还帮助他们获得额外的重要生物学发现。在开发 MozzareLLM 的过程中,Di Bernardo 测试了多种 AI 模型。Claude 的表现始终优于其他模型。

Lundberg 实验室:测试 AI 主导的基因研究目标假设生成

Cheeseman 实验室采用的光学混合筛选技术可在单次实验中敲除数千基因,其瓶颈在于结果解读。但并非所有细胞类型都适用混合筛选方法。斯坦福大学 Lundberg 实验室等研究团队进行的是规模较小、目标集中的筛选实验,他们的瓶颈出现在更前端:如何确定需要靶向的基因。

由于单次聚焦筛选成本可能超过 2 万美元且随规模增加,实验室通常仅选择数百个最可能关联特定条件的基因。传统流程需要研究生和博士后团队逐条添加候选基因并附简要理由或文献链接。这是基于文献调研、专业知识和直觉的「经验猜谜游戏」,受限于人类认知带宽,且依赖已有研究成果和在场人员记忆,难免存在疏漏。

Lundberg 实验室正运用 Claude 颠覆这种方法。他们的系统不再追问「基于已有研究我们能做出哪些推测」,转而探索「基于分子特性应该研究什么」。

团队构建了细胞内所有已知分子(蛋白质、RNA、DNA)的关联图谱,标注蛋白质相互作用、基因编码关系和结构相似性。随后向 Claude 提出目标 —— 例如寻找调控特定细胞结构或过程的基因 ——Claude 通过遍历分子关系图谱,依据生物学特性与关联度筛选候选基因。

该实验室正在开展验证实验,将对比人类专家与 Claude 的表现。若该方法验证有效,团队预期它将成为聚焦扰动筛选的标准前置步骤。实验室无需再依赖直觉博弈或当代研究中盛行的暴力筛选,而是基于信息做出精准靶向决策。

原文链接:https://www.anthropic.com/news/accelerating-scientific-research

编辑:文婧

关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。

新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1213969.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于spring的车辆充电桩管理系统[spring]-计算机毕业设计源码+LW文档

摘要:随着电动汽车的普及,充电桩管理成为影响电动汽车产业发展的重要环节。本文介绍了一款基于Spring框架开发的车辆充电桩管理系统,该系统涵盖系统用户管理、充电桩常识管理、员工管理、用户管理、充电桩类别与管理、培训管理、充值活动管理…

Z-Image-Turbo实战应用:快速生成赛博朋克风格城市

Z-Image-Turbo实战应用:快速生成赛博朋克风格城市 你有没有试过在深夜盯着屏幕,想为一个科幻项目生成一张足够“带感”的城市图景——霓虹流淌、雨雾弥漫、机械与血肉共生,但等了三分钟,进度条才走到67%?又或者刚敲完…

从王坚的一句,到上万名大学生的赛场:中国数据库的“换道超车”之路

“2010年起不再购买小型机! 大数据产业创新服务媒体 ——聚焦数据 改变商业 十多年前,阿里巴巴首席架构师王坚博士这么不经意的一句,像一颗投入湖面的石子,在时任淘宝技术保障部负责人刘振飞心中激起了千层浪。彼时,他…

语音情感数据集构建:SenseVoiceSmall自动标注实战教程

语音情感数据集构建:SenseVoiceSmall自动标注实战教程 1. 为什么需要语音情感数据集? 你有没有遇到过这样的问题:想训练一个能听懂情绪的客服语音系统,却卡在第一步——找不到带情感标签的语音数据?市面上公开的情感…

自动驾驶仿真:SGLang处理多模态指令初探

自动驾驶仿真:SGLang处理多模态指令初探 在智能座舱与自动驾驶仿真测试中,一个常被忽视却至关重要的环节是——如何让大模型真正“看懂”车载屏幕、理解用户自然语言指令,并精准驱动设备执行操作。传统LLM服务仅支持纯文本交互,面…

基于深度学习的船舶检测系统

目录深度学习的船舶检测系统概述关键技术方法典型应用场景性能优化方向源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!深度学习的船舶检测系统概述 深度学习在船舶检测领域通过计算机视觉技术实现对船舶目标的自动识别、定位与跟踪&am…

Unsloth兼容性测试:支持哪些主流模型?

Unsloth兼容性测试:支持哪些主流模型? 在大模型微调领域,选择一个既高效又兼容性强的框架,往往决定了项目能否顺利落地。Unsloth自发布以来,凭借“2倍训练速度、70%显存降低”的硬核指标迅速获得开发者关注。但很多用…

GPT-OSS怎么接入应用?API调用避坑指南

GPT-OSS怎么接入应用?API调用避坑指南 你是不是也遇到过这样的情况:好不容易找到一个开源大模型,部署成功了,网页界面也能跑通,可一到写代码调用API,就卡在报错、超时、格式不对、鉴权失败上?尤…

YOLOv10官版镜像集成TensorRT,速度提升2倍

YOLOv10官版镜像集成TensorRT,速度提升2倍 在目标检测工程落地的实战中,一个反复出现的矛盾始终存在:模型精度越来越高,但推理延迟却成了卡脖子环节。YOLOv10的发布本已带来端到端架构的重大突破——它彻底摆脱了NMS后处理依赖&a…

AI助力Excel:一键生成随机数范围的高级技巧

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个Excel工具,能够根据用户输入的最小值和最大值,自动生成指定数量的随机数。要求:1. 使用Excel公式RANDBETWEEN()实现基础功能&#xff1…

Google AI Studio:AI辅助开发的新利器

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 使用Google AI Studio的AI模型辅助开发一个Python脚本,实现自动化数据清洗功能。要求:1. 输入为CSV文件路径;2. 自动识别并处理缺失值、异常值&…

Sambert语音水印添加:版权保护合成部署教程

Sambert语音水印添加:版权保护合成部署教程 1. 开箱即用的多情感中文语音合成体验 你有没有遇到过这样的问题:辛辛苦苦生成了一段高质量的中文语音,结果被别人直接拿去商用,连个署名都没有?或者在做有声内容分发时&a…

美女教你Python:效率提升10倍的AI编程技巧

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个Python编程效率对比演示应用,要求:1) 展示传统方式编写Python代码的过程 2) 展示使用AI辅助生成同样功能代码的过程 3) 统计并可视化两种方式的时间…

AI如何自动修复Windows驱动错误代码31?

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个AI驱动的Windows驱动修复工具,能够自动检测系统日志,识别错误代码31的根源,提供修复方案。功能包括:1) 扫描系统驱动状态 2…

SEALOS vs 传统部署:效率提升的五大关键点

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个对比分析工具,展示SEALOS与传统部署方式在效率上的差异。工具应包含以下功能:1. 部署时间对比;2. 资源利用率对比;3. 运维复…

SGLang如何简化LLM编程?亲身试用告诉你

SGLang如何简化LLM编程?亲身试用告诉你 你有没有写过这样的代码:为了实现一个带条件分支的多轮对话,要手动管理历史消息、拼接prompt、处理JSON格式约束、反复调用API、再做后处理校验——最后发现,80%的代码其实在和框架“搏斗”…

零基础也能用!YOLOv9官方镜像快速部署实战指南

零基础也能用!YOLOv9官方镜像快速部署实战指南 你是不是也经历过这些时刻: 下载完YOLOv9代码,卡在环境配置上——CUDA版本对不上、PyTorch装错、torchvision报错; 好不容易跑通demo,想换自己的一张图测试,…

AI一键生成Docker-Compose配置,告别手动编写烦恼

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 请生成一个完整的docker-compose.yml配置,包含以下服务:1) Nginx作为反向代理监听80端口 2) Node.js应用运行在3000端口 3) MongoDB数据库带持久化存储 4) …

如何用AI辅助R-Studio数据恢复?智能修复新方法

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个AI辅助的R-Studio数据恢复增强工具,能够自动分析磁盘损坏模式,智能推荐最佳恢复策略。功能包括:1)自动扫描并分类损坏类型 2)基于历史案…

实测cv_resnet18_ocr-detection:单图检测3秒出结果太高效

实测cv_resnet18_ocr-detection:单图检测3秒出结果太高效 1. 这个OCR检测模型到底有多快?实测数据说话 你有没有遇到过这样的场景:手头有一张发票、一份合同或者一张产品说明书,急需把上面的文字快速提取出来,但打开…