谷歌团队在Nature发表的“标杆性成果”,被指不可靠

“谷歌团队在Nature发表的论文并不可靠!”近日,英国利物浦大学的数学家和计算机科学家维塔利·库尔林(Vitaliy Kurlin)团队公开指出,谷歌DeepMind旗下人工智能工具GNoME(材料探索图网络)所生成的晶体数据库中,存在大量的重复或近似重复结构。

这一发现,使谷歌团队此前发表于Nature的相关研究,以及随后关于自主实验室材料合成的论文,成为讨论焦点。过去几年中,库尔林团队创造了一种新的检测重复晶体结构的方法,基于新方法,他们发现了DeepMind团队的“秘密”。

谷歌材料学“新突破”

作为人工智能领域的领军企业,近些年,DeepMind凭借前沿技术,在材料科学领域掀起了不小的波澜。

2023年,该团队在Nature发表一项被誉为“凝聚800年科研成果”的突破性研究。该研究通过自主研发的AI工具GNoME,宣称发现了多达220万个全新晶体结构,其中超38万种被判定为稳定无机材料。

这一数量级在当时创下纪录,被认为有望为半导体、可充电电池等现代技术发展提供潜在材料支撑。

业内人士一度认为,GNoME的研发与应用“堪称AI赋能科研的典型实践”——谷歌团队AI深度学习晶体结构的特征与稳定性规律,借助独特的算法设计,以前所未有的规模和精度,预测新型晶体结构及其稳定性。

在其公布的成果中,涵盖约5.2万种类石墨烯层状化合物与528种锂离子导体。传统研究中,科学家需通过调整已知结构或试错组合元素,来寻找新晶体,过程耗时耗力、成本高昂。

GNoME的出现,被视作破解这一困境的关键。凭借AI的高效计算,它大幅压缩了原本漫长的科研周期,突破了传统研究的瓶颈。该研究在短短两年内引用量飙升至数千次,成为AI在材料科学领域的标杆性成果。

重复数据引发争议

就在GNoME成果被广泛引用、各实验室配套研究同步推进之际,一场针对其数据真实性的质疑悄然蔓延。

利物浦大学库尔林团队研发出一种全新重复检测技术,进而发现GNoME数据库中存在大量重复或高度相似的晶体结构。更关键的是,其中超过10%被标记为“稳定”的晶体,其实只是在已有结构上替换一两个原子,算不上真正的新发现。

这一问题也波及到2023年11月Nature同期发表的另一项补充研究。这项由美国劳伦斯伯克利国家实验室A-Lab完成的自主材料合成成果被认为“也存在严重重复问题”。该实验室声称在17天内合成了43种新材料,但其中2种早已录入无机晶体结构数据库,其余41种在同一数据库中也均有几乎完全一致的副本。

面对确凿的检测数据,各相关方的反应不一。库尔林团队发布数据后,GNoME数据库中超过8.3万条内容被悄悄删除,谷歌未对此作出公开说明。

美国化学会媒体联系GNoME论文作者及谷歌公关,未获回应。

英国伦敦大学学院的罗伯特·帕尔格雷夫(Robert Palgrave)呼吁撤下A-Lab论文,但认为GNoME研究发更正即可。

库尔林则主张两篇都应撤稿。Nature编辑卡尔·齐梅利斯(Karl Ziemelis)表示,A-Lab论文准备“更正”,GNoME研究因未收到“正式关切”(formal concerns),暂不调查。

各数据库处理方式也不同:“材料项目”承认重复问题,考虑引入新检测方法;晶体学开放数据库负责人索利乌斯·格拉祖利斯(Saulius Gražulis)认可该方法,目前仅标注重复而非删除。

英国剑桥结构数据库执行董事苏珊娜·沃德(Suzanna Ward)认为,重复原因多样,不宜“一刀切”删除,简单化合物的相似结构属正常,不会移除。

AI科研何去何从?

有评论认为,此番争议不仅聚焦于谷歌的两项研究,更暴露了AI大模型在科研应用中的深层矛盾:当技术追求规模与效率时,如何兼顾数据的真实性与新颖性?同时,这也对晶体学数据库的管理模式、AI生成内容的评估标准提出了严峻拷问。

目前,学界普遍认为,应当将库尔林团队这类高效的重复检测工具整合到AI研发流程中,在数据输出前自动筛选绝对重复的内容。同时,需要强化同行评审的针对性:对于AI生成的大规模数据集,应要求研究者提供抽样验证报告及重复检测证明,而非仅依赖算法本身的可信度。

晶体学数据库的重复乱象并非个例,有机、无机及计算机生成的晶体数据存储均受此困扰。其实,数据库管理者也面临两难:一方面,理想状态下“优质数据库不应存在重复”;另一方面,重复结构的成因复杂,不能简单归为数据完整性问题。

对此,业内已形成几点共识:建立分层处理机制,区分“完全重复”与“近似重复”、“恶意重复”与“合理重复”,后者包括因独立发现导致的重复,应避免采取单一的删除或保留政策。引入标准化检测工具,推广开源、高效的重复检测技术,让数据库在接收数据时就能进行初步筛查,从源头减少重复条目。

有学者指出,AI技术为科研带来了效率革命,但绝不能以牺牲科研诚信为代价。在此次争议中,GNoME数据库悄悄删除重复条目却不公开说明的做法,引发了学界对数据透明度的广泛担忧。科研的核心价值在于探索未知,AI应是辅助这一过程的工具,而非追求虚假规模的捷径。

前述学者还认为,未来需要建立针对AI科研的伦理规范,明确研究者、期刊、数据库各方的责任:研究者需对AI生成数据的真实性进行严格核验,期刊需强化对大规模AI成果的评审标准,数据库需完善重复数据的管理与披露机制。

毫无疑问,这场围绕220万晶体结构的争议,本质上是AI时代科研范式转型过程中的一次阵痛。它提醒我们,在追逐技术突破的同时,更需要坚守真实性、透明度的科研底线。

“唯有建立完善的评估体系与伦理规范,才能让AI真正成为推动科学进步的强大动力,而非制造科研泡沫的潜在隐患。”这位学者说。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1156294.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot+Vue 汽车票网上预订系统平台完整项目源码+SQL脚本+接口文档【Java Web毕设】

💡实话实说:CSDN上做毕设辅导的都是专业技术服务,大家都要生活,这个很正常。我和其他人不同的是,我有自己的项目库存,不需要找别人拿货再加价,所以能给到超低价格。摘要 随着互联网技术的快速发…

proteus示波器用于AT89C51看门狗定时器验证的完整流程

用Proteus示波器“看见”AT89C51看门狗的生死轮回你有没有过这样的经历:单片机系统跑着跑着突然死机,重启后又恢复正常?你想知道它到底“死”在了哪里吗?在真实世界里,这类故障往往难以复现、无从追踪。但借助Proteus这…

基于PCAN的远程IO控制系统:项目应用

从车间布线到智能控制:PCAN如何重塑远程IO系统在一家中型自动化设备厂的装配线上,工程师老李正蹲在电控柜前皱眉——又一条继电器控制线断了。这已经是本周第三次因为现场传感器信号干扰导致误动作。他叹了口气:“要是能把这些密密麻麻的线都…

Python测试开发工具库:测试环境变量统一配置与加载工具

目录 一、为什么需要环境变量统一配置工具? 二、核心原理:配置加载的底层逻辑 三、设计思路:如何打造一个好用的配置加载工具? 3.1 配置文件格式选型 3.2 多环境支持 3.3 环境切换方式 3.4 配置加载与调用 3.5 敏感信息处…

核心要点:STLink驱动安装教程中的权限问题处理

ST-Link权限配置实战:从“Permission Denied”到即插即用的工程化路径 你有没有遇到过这样的场景?刚把ST-Link插上Linux电脑,兴冲冲打开VS Code准备调试STM32代码,结果OpenOCD报错: Error: open failed: Permission …

低功耗MCU中UDS诊断唤醒机制设计完整指南

低功耗MCU中UDS诊断唤醒机制设计完整指南当汽车熄火后,ECU还能“听见”诊断请求吗?在一辆现代智能汽车里,即使钥匙拔出、整车断电,某些电子控制单元(ECU)仍需保持“半睡半醒”的状态——它们要监听来自诊断…

一盏照亮美业前路的“灯塔”

走进任何一家美发或美容店,你总能听到管理者相似的感慨:“任务布置下去,总是执行不到位。” 这背后,是美业长久以来的管理隐痛——执行力缺失。 在传统管理模式中,门店的任务推进往往依赖人情与口头督促。店长反复提醒…

vitis安装实战案例:结合Vivado实现一体化平台部署

手把手部署Vitis Vivado一体化开发平台:从零搭建Zynq MPSoC图像处理系统 你有没有遇到过这样的场景? 在FPGA项目中,刚用Vivado完成硬件设计,导出 .xsa 文件准备进软件开发时,Vitis却提示“无法识别平台”&#xf…

精密制造行业应用AR装配技术

在元幂境看来,随着全球制造业逐步向高端化、智能化发展,精密制造行业正成为产业升级的关键支撑力量。精密制造强调零部件的微米级、纳米级加工精度以及高度复杂的工艺流程,对装配质量和效率提出了前所未有的要求。在这一背景下,A技…

用户 APC 的执行过程(下)

前言 在之前的文章 中,我们已经分析了:内核如何在 KiDeliverApc 中识别用户 APC如何调用 KiInitializeUserApc以及它如何修改 TrapFrame 与用户栈,为用户 APC 的执行提前“铺好路”但需要特别强调的是:KiInitializeUserApc 并不执…

Keil+STM32调试多任务系统:实战案例分享

用Keil玩转STM32多任务系统:从崩溃现场到稳定运行的实战之路你有没有遇到过这样的场景?代码明明逻辑清晰、编译通过,烧进去后却在某个莫名其妙的时刻突然“死机”,串口啥也没输出,或者只留下一句孤零零的HardFault。更…

STM32CubeMX点亮LED灯:超详细版入门实战指南

用STM32CubeMX点亮LED灯:从零开始的实战入门课你有没有试过,手握一块STM32开发板,电脑上装好了IDE,却卡在第一步——连个LED都点不亮?别急,这几乎是每个嵌入式新手都会踩的坑。寄存器不会配、时钟树看不懂、…

PTL仓储亮灯系统如何实现拣选“零”误差运营?

仓储运营中,拣选环节的速度和精准,直接影响整体物流成本与客户体验。随着仓储管理向智能化、数字化演进,PTL(Pick-to-Light)亮灯拣选系统凭借其直观、高效的作业方式,逐渐成为高精度拣选场景下的重要工具。…

⚡_实时系统性能优化:从毫秒到微秒的突破[20260113173734]

作为一名专注于实时系统性能优化的工程师,我在过去的项目中积累了丰富的低延迟优化经验。实时系统对性能的要求极其严格,任何微小的延迟都可能影响系统的正确性和用户体验。今天我要分享的是在实时系统中实现从毫秒到微秒级性能突破的实战经验。 &#…

Keil与ST-Link连接配置:新手友好型指南

Keil与ST-Link连接配置:从“连不上”到“一按就跑”的实战指南 你有没有过这样的经历? 代码写得信心满满,点击Keil的“Download”按钮——结果弹出一个无情提示:“ Cortex-M device not responding. ” 或者更糟:…

[特殊字符]_安全性能平衡术:如何在保证安全的前提下提升性能[20260113174726]

作为一名经历过多次安全事件的工程师,我深知在Web应用开发中安全与性能的平衡是多么重要。最近,我参与了一个金融级应用的开发,这个项目让我重新思考了安全机制对性能的影响。今天我要分享的是如何在保证安全的前提下提升Web应用性能的经验。…

STM32芯片调试:JLink仿真器时序控制全面讲解

深入STM32调试核心:JLink仿真器时序控制实战全解析你有没有遇到过这样的场景?代码烧录到STM32H7上,JLink连接失败,反复提示“Cannot connect to target”;或者刚进入单步调试,定时器却在疯狂输出PWM波&…

解决 smb 签名漏洞 SMB Signing not required

检测代码,两个都为 True 就是修复了 Get-SmbServerConfiguration | Select-Object RequireSecuritySignature, EnableSecuritySignature修复代码 Write-Host "--- Enabling SMB Signing (Mandatory) ---" -ForegroundColor Cyan# 1. 针对服务端 (Server) …

高压电缆故障预警与定位:基于行波与北斗的高精度监测系统解析

高压电缆是电力输送的“大动脉”,一旦发生故障,不仅影响供电稳定性,还可能引发安全事故。如何在故障发生后迅速定位、快速修复,是电力运维中的一大难题。近年来,随着电力物联网和北斗技术的发展,基于行波定…

python 代码扫描 icmp 时间戳漏洞 ICMP Timestamp Request Remote Date Disclosure

from scapy.all import * import timedef verify_fix(ip):# 构造请求pkt IP(dstip) / ICMP(type13)print(f"正在发送 Type 13 请求到 {ip}...")# 发送包并设置严格的超时时间(2秒)reply sr1(pkt, timeout2, verboseFalse)if reply is None:p…