数学家陶哲轩直言:大语言模型和其他现代AI的数学门槛没那么高,却有个“致命短板”至今无解

来源:跟着大咖学AI


著名数学家、菲尔兹获得者陶哲轩在最近的一次视频访谈中谈到AI并发表了自己的观点。他认为,训练和运行大语言模型和其他现代AI所需的数学知识并不高深,本科数学专业的基础就足够支撑,核心只需掌握矩阵乘法和基础微积分。

人类早已掌握大语言模型的搭建、训练和运行方法,真正的核心难题并非“如何让模型跑起来”,而是缺乏可靠的理论框架来提前预测其任务表现。

以下相关视频和文字内容:

『 训练和运行大语言模型(或其他现代 AI)所需的数学知识并没有那么复杂。本科数学专业的学生就已经具备了必要的相关知识 —— 本质上,你只需要掌握矩阵乘法和一点微积分就行。

The mathematics required to train and run a large language model (or any other modern AI) isn’t that complicated. An undergraduate math major already has all the necessary prerequisites—basically, you just need to understand matrix multiplication and a bit of calculus.

真正的难点不在于让这些模型 “如何运行”,我们已经知道怎么构建、训练和操作大语言模型了。难点在于理论层面我们缺少可靠的方法来评估或预测它们的性能。

The real challenge isn’thowthese models run (we know how to build, train, and operate large language models). Instead, the problem lies in theory: we lack a reliable way to evaluate or predict their performance.

让人意外的是,这些模型在某些任务上表现极佳,在另一些任务上却效果很差,但我们没法提前预判哪些任务会是哪种情况。我们甚至连基础的经验法则都没有,只能依赖实证实验。

What’s surprising is that these models work extremely well for some tasks but poorly for others—and we can’t predict which tasks will fall into which category in advance. We don’t even have basic heuristic rules of thumb for this; we can only rely on empirical experiments.』

视频来源:

https://www.youtube.com/watch?v=ukpCHo5v-Gc ,油管 ,@DrBrianKeating

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1141355.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

完整示例:Proteus中构建独立按键+数码管电路

从零搭建一个按键计数器:Proteus中独立按键与数码管的实战教学你有没有过这样的经历?在单片机实验课上,接了一堆线,结果数码管不亮、按键失灵,查了半小时才发现是忘了加个上拉电阻。或者更惨——明明代码逻辑没问题&am…

hal_uart_transmit在PLC通信中的应用:实战案例解析

hal_uart_transmit如何让PLC通信稳如磐石?一个工业网关的实战复盘你有没有遇到过这样的场景:明明代码逻辑没问题,但Modbus请求发出去后,PLC就是不回?或者系统跑着跑着突然卡死,查来查去发现是串口发送卡住了…

前端开发利器 hbuilderx下载 后的初始化设置说明

从零开始打造高效开发流:HBuilderX 下载后必做的初始化配置指南你是不是也经历过这样的场景?刚完成hbuilderx下载,兴冲冲打开软件准备写代码,结果发现编辑器乱糟糟、缩进不统一、提示不准、运行还要手动刷新……明明是想提效的工具…

screen指令在ARM开发板调试中的应用详解

用screen调试 ARM 开发板:从串口连接到多任务协同的实战指南你有没有遇到过这样的场景?深夜正在远程调试一块远在实验室的ARM开发板,系统启动卡在某个阶段。你盯着终端一行行刷出的内核日志,正准备进入U-Boot修改启动参数——突然…

救命神器2026 TOP10 AI论文软件:专科生毕业论文救星测评

救命神器2026 TOP10 AI论文软件:专科生毕业论文救星测评 2026年AI论文工具测评:专科生毕业论文的高效助手 随着人工智能技术的不断进步,AI写作工具在学术领域的应用越来越广泛。对于专科生而言,撰写毕业论文不仅是学业的重要环节&…

达美乐中国1月1日在46个城市新开62家门店 | 美通社头条

、美通社消息:达势股份(达美乐中国)(1405.HK)2025年第四季度延续强劲增长势头,通过门店网络纵深拓展、核心产品持续创新升级以及季节性营销活动的成功破圈,进一步巩固消费社群粘性,圆满达成全年开店目标,持续夯实其在中…

利用UART串口通信实现HMI与控制器互联:完整示例

从零构建HMI通信链路:深入理解UART与Modbus在嵌入式系统中的实战应用你有没有遇到过这样的场景?设备已经跑起来了,传感器数据也采集好了,但用户却不知道怎么查看温度、修改参数。只能靠一堆LED灯闪烁来“猜”状态——这显然不是现…

新手必看:工业控制项目中正确使用STLink引脚图

工业控制调试不翻车:一张STLink引脚图背后的硬核细节你有没有过这样的经历?深夜赶工,终于写完一段关键的电机控制代码,兴冲冲插上STLink准备烧录——结果IDE弹出“No target connected”;再一摸STLink外壳,…

ue5 插件 WebSocket

WebSocket Plugin for Unreal Engine fab中搜索: WebSocket 2025 https://blog.csdn.net/qq_17523181/article/details/134514744 插件:2022年: https://github.com/inveta/InWebSocketClient

全网最全8个AI论文工具,专科生搞定毕业论文!

全网最全8个AI论文工具,专科生搞定毕业论文! 专科生的论文救星:AI 工具如何改变你的写作方式 在当今快节奏的学习生活中,专科生面临着毕业论文的巨大压力。从选题到撰写,再到查重降重,每一个环节都可能让人…

使用Keil uVision5进行工控系统故障追踪:调试全解

用Keil uVision5做工控系统调试,我是怎么把“随机死机”揪出来的 你有没有遇到过这种问题:设备在实验室跑得好好的,一上现场就隔三差五重启?日志没输出,复现不了,客户催着要结果——典型的“偶发故障”&…

vivado2025中集成DMA的高效通信系统实战案例

用Vivado 2025打造高效DMA通信系统:从理论到实战的完整闭环当数据洪流来袭,CPU还能扛得住吗?在今天的嵌入式世界里,“快”早已不是锦上添花,而是生存底线。无论是4K视频实时分析、雷达回波采集,还是边缘AI推…

一文说清STM32MP1在ARM平台上的资源分配策略

STM32MP1 的“双核心法”:如何让 Linux 与实时控制和平共处? 在嵌入式开发的世界里,我们常常面临一个两难选择: 要性能,还是实时性? 运行 Linux,意味着你能轻松接入网络、跑图形界面、用现成…

手把手教你用寄存器映射理解ISR入口地址设置

手把手教你从寄存器映射看透ISR入口地址的底层真相你有没有遇到过这样的情况:明明配置好了GPIO中断,NVIC也使能了,但就是进不了EXTI0_IRQHandler?或者OTA升级后系统一跳转就Hard Fault,调试器一看堆栈全乱了&#xff1…

快速理解交叉编译工具链三元组:工业嵌入式入门必看

交叉编译三元组:嵌入式工程师必须搞懂的“语言密码”你有没有遇到过这样的情况?写好的C代码,在PC上编译毫无问题,烧进STM32却直接卡死;或者用arm-linux-gnueabihf-gcc编出来的程序,放到一个裸机ARM Cortex-…

大数据挖掘中的自动化异常检测

大数据挖掘中的自动化异常检测:从原理到工业级落地 一、引言:那些被“异常”支配的恐惧 你有没有遇到过这样的场景? 凌晨3点,运维群突然炸了:“服务器CPU利用率飙升到99%!”等你揉着眼睛登录后台,却发现是某个测试脚本忘了关,白熬了半宿; 电商大促后,财务核对订单时…

Keil5智能感知配置实战:从零实现自动补全

Keil5智能感知实战:手把手教你开启代码自动补全你有没有过这样的经历?在Keil里敲RCC->,想看看APB1时钟使能寄存器叫什么名字,结果按了.却啥都不出;或者写HAL_UART_Transmit()的时候记不清参数顺序,只能切…

STM32CubeMX固件包下载支持的USB类型全面讲解

STM32开发中的USB全解析:从固件下载到调试升级的实战指南 你有没有遇到过这种情况: 明明代码写好了,STM32CubeMX也配置完毕,结果一点击“下载”,PC却死活识别不到你的开发板? 或者好不容易烧录成功&…

基于nodejs+Vue学生社团管理系统的设计与实现_33x07u9r

文章目录摘要内容关键词项目技术介绍开发工具和技术简介nodejs类核心代码部分展示结论源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!摘要内容 该系统基于Node.js与Vue.js构建,采用前后端分离架构,实现学生社团…

ego1开发板大作业vivado:硬件描述基础全面讲解

从零开始玩转 ego1 开发板:Vivado 硬件设计实战全解析你是不是也曾在“数字逻辑”课上对着 Vivado 一头雾水?明明代码写得和示例一模一样,为什么下载到 ego1 开发板后 LED 就是不亮?时序报错一大堆,综合直接失败……别…