

论文标题:A Definition of AGI
作者团队:人工智能安全中心、加州大学伯克利分校、Morph实验室、密歇根大学等
发布时间:2025年10月21日
👉一键直达论文
👉Lab4AI大模型实验室论文阅读
✅Lab4AI平台提供AI导读和AI翻译等工具,辅助论文阅读。您还可以投稿复现这篇论文~
⭐论文简介
本文旨在提出一个全面、可量化的框架,以澄清AGI的定义,并精确测量AI系统在通用认知能力上与人类的差距。其核心目标是将AGI操作化定义为“能够匹配或超越一位受过良好教育的成年人的认知广度和熟练度”,从而为评估AI系统提供一个坚实、统一的基准。
⭐核心贡献
本文的核心贡献是首次引入了一个基于人类认知心理学经典理论的、系统化的AGI量化评估框架。该框架:
- 提出了一个从0%到100%的标准化“AGI分数”,使不同AI系统的通用智能水平可以相互比较。
- 明确指出AGI不仅仅是经济价值或自动化潜力的代名词,而是专注于认知能力的评估。
⭐研究方法
核心是借鉴并改造用于评估人类智力的心理测量学方法,将其应用于AI系统评估。
- 理论基础:以CHC人类认知能力理论为蓝图,将通用智能分解为10个核心认知领域(广度能力),每个领域权重为10%。
- 评估维度:这十个领域包括:通用知识、读写能力、数学能力、即时推理、工作记忆、长期记忆存储、长期记忆提取、视觉处理、听觉处理和处理速度。
- 操作化:为每个认知领域设计了一系列具体的测试任务(窄能力),这些任务改编自成熟的人类心理测量量表要求AI系统在多模态(文本、视觉、听觉)环境下接受评估。
⭐研究结果
应用框架评估GPT4、GPT5,揭示关键发现:AI呈“锯齿状”认知剖面,知识密集领域表现优、基础认知有缺陷;长期记忆近零是AGI瓶颈,即时/视觉推理亦弱;给出AGI分数,显进步与人类智能差距;模型以优势补弱势,造“通用性”假象,实则脆弱低效。