强化学习之父 Richard Sutton: 如今AI正进入“经验时代” - 指南

news/2025/9/20 9:09:38/文章来源:https://www.cnblogs.com/yfceshi/p/19102002

2024年图灵奖得主、“强化学习之父”理查德·萨顿(Richard Sutton)在2025 Inclusion·外滩大会上发表主旨演讲,他认为,人类信息红利正逼近极限,人工智能正在进入以持续学习为核心的“经验时代”,潜力将远超以往。

萨顿表示,大多数机器学习的目标,是把人类已有的知识转移到静态、缺乏自主学习能力的AI 上。“大家逐渐达到人类数据的极限,现有的方法不能生成新的知识,不适合持续学习,而持续学习对智能的效用至关重要。”

他认为,我们正进入“经验时代”,需要一种新的数据源,由智能体与世界直接交互中生成。这正是人类和其他动物的学习方式,是AlphaGo自我博弈下的“第37手”,也是近期AlphaProof在国际数学奥林匹克斩获银牌的路径。

萨顿解释,“经验”指的是观察、行动和奖励,这三种信号在智能体与世界之间来回传递。“知识来自于经验,可以从经验中学习。一个智能体的智能程度,取决于它能预测并控制自身输入信号的程度。经验是一切智能的核心与基础。”他同时指出,强化学习带领大家进入了新的经验时代,但要释放全部潜力,还需要两项目前尚不成熟的技术——持续学习(continual learning)和元学习(meta-learning)技术。

面对外界对AI带来偏见、失业甚至人类灭绝的担忧,萨顿认为,这种对人工智能的恐惧被夸大了,目标不同的智能体,可以通过去中心化的协作实现双赢。“人类最卓越的超能力,就在于比其他任何动物都更擅长协作。人类最伟大的成功在协作本身——经济、市场与政府都是成功协作的产物。”萨顿表示,人工智能和人类繁荣将来自于去中心化协作,“协作并非总能实现,却是世间一切美好事物的源泉,大家必须寻求协作、支持协作,并致力将协作制度化。”

他认为,在人类的发展进程中,人工智能的替代将是不可避免的。而人类至少是催化剂,是助产士,更是开启宇宙第四大时代——“设计时代”的先驱。萨顿将宇宙历史分为四个时代:粒子时代、恒星时代、复制者时代和设计时代。

“人工智能是宇宙演化的必然下一步,我们应以勇气、自豪和冒险精神来迎接它。”萨顿表示。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/908222.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java 注解 - 实践

Java 注解 - 实践2025-09-20 08:52 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-fami…

安规对变压器的绝缘系统要求

安规对变压器的绝缘系统要求2025-09-20 08:54 斑鸠,一生。 阅读(0) 评论(0) 收藏 举报

嵌入式笔记系列——UART:TTL-UART、RS-232、RS-422、RS-485 - 指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

实用指南:医院高值耗材智能化管理路径分析(下)

实用指南:医院高值耗材智能化管理路径分析(下)pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas",…

Flutter应用自动更新系统:生产环境的挑战与解决方案

Flutter应用自动更新系统:生产环境的挑战与解决方案本文基于BeeCount(蜜蜂记账)项目的实际开发经验,深入探讨Android应用自动更新的完整实现,包括GitHub Releases集成、APK安装、R8混淆问题处理等核心技术难点。项目…

.NET Core中使用SignalR

.NET Core中使用SignalR基本介绍 1.什么是signalRSignalR 是微软开发的一个开源库,它可以让服务器端代码能够即时推送内容到连接的客户端,用来简化向客户端应用程序添加实时功能的过程。大白话的意思就是微软搞了一个…

Django + Vue3 前后端分离工艺实现自动化测试平台从零到有系列 <第一章> 之 注册登录完成

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

实用指南:【保姆级教程】TEXTurePaper运行环境搭建与Stable Diffusion模型本地化

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

实用指南:修复Conda连接异常:CondaHTTPError HTTP 000 CONNECTION FAILED故障排除指南

实用指南:修复Conda连接异常:CondaHTTPError HTTP 000 CONNECTION FAILED故障排除指南pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important…

高级数据结构手册

LCA //exam:P3379 【模板】最近公共祖先(LCA) #include <iostream> #include <cstdio> #include <vector> #define int long long using namespace std; const int MAXN=5e5+5,MAXM=25; void dfs…

3634501 - [CVE-2025-42944] Insecure Deserialization vulnerability in SAP Netweaver (RMI-P4)

3634501 - [CVE-2025-42944] Insecure Deserialization vulnerability in SAP Netweaver (RMI-P4)Symptom Due to a deserialization vulnerability in SAP NetWeaver, an unauthenticated attacker could exploit the…

【无人艇协同】基于matlab面向海事安全的双体无人艇分布式协同任务规划(目标函数:总时间满意度)【含Matlab源码 14161期】博士论文 - 教程

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

实用指南:Unity 打包 iOS,Xcode 构建并上传 App Store

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

实用指南:GitHub 热榜项目 - 日榜(2025-09-09)

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

深入解析:【Fiora深度解析】手把手教你用固定公网IP搭建专属聊天系统!

深入解析:【Fiora深度解析】手把手教你用固定公网IP搭建专属聊天系统!2025-09-20 08:13 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: au…

使用JavaScript和CSS创建动态高亮导航栏

本文详细介绍了两种实现动态高亮导航栏的技术方案:第一种使用getBoundingClientRect方法精确计算元素位置和尺寸,第二种利用新兴的View Transition API简化动画实现。文章包含完整的代码示例和实际演示,适合前端开发…

wxt 开发浏览器插件的框架

wxt 开发浏览器插件的框架wxt 开发浏览器插件的框架 支持的特性支持所有浏览器 支持mv2 以及mv3 协议 开发模式支持热更新 基于文件的entrypoints 基于ts 开发 支持自动导入 自动发布 支持vue,react,svelte 等框架说…

Gridspech 全通关

You made it to the end of Gridspech. Thank you for playing!!A1A2A3A4A5A6A7A8A9A10A11A12A13A14

20253320蒋丰任

1.我叫蒋丰任,是一个阳光开朗大男孩,因为有一首我挺喜欢的歌就叫这个,同时我的朋友和我自己都认为我是一个外向的社牛(在广东,到了北京,比起东北大哥的热情,我自愧不如)。 2.办公软件的使用(Excel),一定要谦…