从AGI炒作到工程现实:大语言模型的未来发展方向

如果我们想知道大语言模型提供商在未来几年将如何改进他们的服务,可以先预测当前的限制将如何被解决。虽然大语言模型在聊天框格式中表现相当成功,但它们在能耗方面成本高昂,并且在幻觉问题上存在持续困扰。软件开发者需要不断增加Token使用量才能获得更聚焦的结果。

在弄清楚模型规模与训练如何真正影响输出方面仍有一些猜测成分,但能耗和幻觉问题已经限制了扩张。因此,本文探讨了大语言模型提供商可能选择的发展方向。

但首先我们必须检验Yann LeCun关于大语言模型是死胡同的预测的有效性。虽然这在"通用人工智能"方面可能最终是正确的,但AI公司投入的大量资金和势头确保我们在一段时间内仍将使用大语言模型。LeCun本人也推出了一家初创公司,"继续我在过去几年中一直在进行的先进机器智能研究项目(AMI)",但这不会很快产生成果。

知识图谱和本体论的回归

许多旧的AI方法已经被大语言模型的成功所掩盖,但我仍然记得曾经人们认为人工智能将由大型本体论组成——可以将其视为概念图,非常像标签,用于在某种正式结构中连接想法。由于大语言模型在大量信息上进行训练,它们以某种随机方式内化概念,但似乎理解事物之间的关系。但我们知道大语言模型可以帮助创建知识图谱;检索增强生成(RAG)是保持大语言模型回答诚实的重要方法,通过为其提供格式化的专家知识。

对抗幻觉的一种可能方法是专注于在特定主题领域维护大量知识图谱,并在其他提供商服务之间共享这些图谱。

这样做的压力可能来自监管。例如,我们最近看到澳大利亚对社交网络实施年龄限制,因为屏幕成瘾对儿童有各种负面影响。因此,可能需要创建相当于"儿童大英百科全书"的东西——一套不会泄露有问题领域事实的大型信息集。由第三方维护,更受监管的信息可能会说服各国政府大语言模型不会传播有偏见的事实。

标准化和互操作性

正式共享大量信息可能会与竞争提供商的商业模式产生冲突,但合作仍然可能带来效率节省。

我们在这里已经有一些希望:Anthropic的模型上下文协议(MCP)作为"大语言模型的USB"的早期且令人意外的普遍接受,可能告诉我们,当一个想法足够好时,竞争提供商(如OpenAI)会采用它。

OpenAI已经通过其应用SDK和如何与其Atlas浏览器配合使用强调了可能的分发模型。这里的想法是将本地知识直接视为大语言模型可以调用的MCP服务器。这样,OpenAI正在尝试取代网络——通过其ChatGPT模型回答一般查询,但调用用户应用服务器获取本地专家信息。就像OpenAI使用MCP工具访问硬盘一样。

本地与云端的混合模型

许多人已经在本地运行大语言模型,我们在过去几年中向读者展示了这样做的方法。虽然大型前沿模型将保留在云端,但有很多用户可以在笔记本电脑上运行的较小预训练开源模型。本地运行仍然有些技术性,但像Ollama这样的应用使其变得更加简单。当然,终极本地机器很可能是你的手机。

我们已经看到智能体命令行系统如何为一些查询选择快速便宜的模型,将更昂贵的模型留给"深度思考"或"规划"。这导致了也许使用本地模型处理较小查询,同时将更困难的查询发送到云端运行的更大模型的想法。

个性化和上下文理解

寻找本地化的另一个原因是获取用户的个人上下文。当我们看到Google在回答用户查询方面历来表现优秀,因为它对用户了解足够多以排除不相关结果时,这开始变得很有意义。

可以合理假设亚马逊使用来自数百万Alexa扬声器的信息训练大语言模型,并识别家庭中个别说话者的身份。但本地大语言模型可以直接听取和阅读你的所有语音和内容,以便充分了解不仅是你的地理位置,还有你详细的兴趣。

虽然"生活流应用"可能带来的奥威尔式后果在2010年代确实让我们感到担忧,但我们仍然用连续的状态报告填充它们。智能体命令行界面使用设置markdown文件为大语言模型提供项目提示,因此长期分析用户肯定会更有效率。据说苏格拉底曾说"不经审视的生活不值得过",虽然我怀疑他会赞成AI,但适度的记录确实可以为大语言模型提供丰富的(如果是个人的)图谱来开始工作。

市场现实与未来展望

在大型提供商着手改进效率,或投资者不再追逐"通用人工智能"之前,市场可能需要一个小的"修正"(即崩溃)。也许大公司将共同转向另一个炒作领域,以继续AI势头并保持其股价高位。但工程转向改进现有投资的可能性很大。

如果你在软件开发中使用大语言模型,你将在前排观看任何即将到来的变化。

Q&A

Q1:大语言模型目前面临哪些主要限制?

A:大语言模型主要面临三个限制:能耗成本高昂、持续的幻觉问题,以及软件开发者需要不断增加Token使用量才能获得更聚焦的结果。这些问题已经限制了模型规模的进一步扩张。

Q2:什么是模型上下文协议MCP?它有什么作用?

A:MCP是Anthropic开发的模型上下文协议,被称为"大语言模型的USB"。它允许大语言模型调用本地知识和应用服务器,实现标准化和互操作性,甚至竞争对手OpenAI也采用了这个协议。

Q3:本地运行大语言模型有什么优势?

A:本地运行大语言模型可以获取用户的个人上下文,包括地理位置和详细兴趣。同时可以实现混合模型,用本地模型处理简单查询,复杂查询则发送到云端,既提高效率又降低成本。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1155373.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

精选电路 —— 12V、5V、3.3V 宽电压电源电路

电源是系统的能量稳定的电源可保障系统稳定运行。电源供应不稳定,如出现电压过高、过低或者频繁波动,会对系统硬件造成损害。例如,电压过高可能会烧毁电子元件,导致系统故障;而电压过低可能使系统运行出错,…

专业深研:2026中国GEO服务商——多维度深度剖析与场景化应用解读

当 AI 搜索成为“第一入口”,谁把品牌写进大模型的“标准答案”?——8 家主流 GEO(Generative Engine Optimization)厂商横评数据来源:中国信通院《2026 生成式搜索白皮书》、艾瑞《AI 搜索广告价值研究报告》、各厂商…

CTF比赛入门全指南:从零基础到实战夺旗的成长路径

CTF比赛入门全指南:从零基础到实战夺旗的成长路径 在网络安全领域,CTF(Capture The Flag,夺旗赛)是检验技术实力、积累实战经验的核心载体。无论是安全专业学生、职场新人,还是想转型安全领域的从业者&…

【珍藏】大模型意图识别在智能电视中的落地实践:三种方案对比与7B模型微调实战指南

本文详细介绍了大模型意图识别技术在智能电视核心交互链路中的落地实践。通过对比基础模型Prompt、RAG增强及7B模型微调三种方案,最终采用LoRA方式微调7B模型,实现了500ms低延迟和98%高准确率的意图识别效果。同时提出了自动质检和微调的进阶方案&#x…

基于微信小程序的师范生实习管理系统-计算机毕业设计源码+LW文档免费

摘 要 随着新世纪无纸化办公方式的普及,自动化信息处理和基于网络的信息交互方式已被广泛应用。现在很多行业基本上都是交由计算机进行管理和测试,网络与计算机已成为整个线上管理体系中的重要组成部分。虽然信息技术广泛应用和数据存取更加方便&#xf…

基于微信小程序的网络安全知识科普平台-计算机毕业设计源码+LW文档免费

1.研究目的 随着互联网的快速发展,网络安全问题日益突出,个人信息泄露、网络诈骗、恶意攻击等安全风险层出不穷。提升公众的网络安全意识和防护能力成为社会各界关注的重点。然而,目前的网络安全知识普及方式较为单一,存在碎片化、…

model.onnx 深度分析报告(系列汇总)

📚 文档概览 本系列共包含 3篇深度技术文档,全面解析 model.onnx 文件的功能、原理、实现和优化技术。 总字数:约 5万字 阅读时间:约 3-4 小时 适合人群:AI工程师、后端开发工程师、架构师📖 系列文档导航 …

大数据领域数据科学的流处理系统性能优化

大数据领域数据科学的流处理系统性能优化:从流水线到超高速列车的升级之旅关键词:流处理系统、性能优化、大数据、实时计算、延迟与吞吐量摘要:在大数据时代,实时推荐、风控预警、物联网监控等场景对数据处理的“即时性”提出了极…

收藏!应届生刚毕业就年薪百万?35+程序员稳拿高薪的核心密码

2026年职场圈最炸的消息,莫过于猎聘网曝光的一则招聘启事——某头部AI芯片企业为校招算法工程师开出80万-120万的年薪区间,直接刷新了应届生薪资天花板! 与此同时,另一个现象同样引发程序员群体热议:不少35、40的资深…

企业微信质检新标准:微盛·企微管家如何助力提升客户满意度?

一、企业微信质检的现状与挑战 2025年,企业微信服务触点突破7.5亿,超1400万企业通过这一平台服务用户。但在庞大的服务量背后,企业正面临三大核心挑战:人工抽检覆盖率仅3%(如一汽红旗客服团队,过去依赖人工…

springboot引用其他中间件,如何确定版本

Spring Boot 对应版本依赖查找指南 📋 方法一:Spring Boot 官方依赖版本表(最权威) 步骤: 打开:https://docs.spring.io/spring-boot/docs/[你的版本]/reference/html/dependency-versions.html搜索关键字 …

取代产品岗,又一新兴岗位在崛起!这才是产品经理未来5年最好的就业方向!

过去靠画原型、写PRD、追项目进度的“传统技能包”,在AI技术狂飙的时代里,正在加速贬值。 63% 的企业扎堆转型布局 AI 产品! 当下产品人的核心命题,早已不是“要不要学 AI”,而是**“如何从0到1构建落地 AI 产品”**。…

JNPF 权限示例太绝了!PC/APP 全场景覆盖,授权逻辑一看就懂

配置用户权限总踩坑? PC 端和 APP 端权限分不清、角色 岗位权限叠加一脸懵、流程 / 打印权限不知道咋分配? JNPF 直接甩出保姆级权限操作示例!从无权限场景到角色 岗位叠加授权,从 PC 端到 APP 端,10 常见场景全覆…

深圳/北京企业服务行业GEO服务商测评:SaaS产品AI获客与对比类Query优化(2025)

《2025中国企业服务市场报告》显示,SaaS行业获客成本持续攀升,某北京CRM厂商反馈,百度竞价CPL从2023年的420元涨至2025年的980元,而线索转化率从8.2%跌至3.5%。传统获客模式正面临失效危机。与此同时,AI搜索为SaaS企业…

2026年如何做好企业微信私域运营?AI全链路增长实战指南

一、2026年私域运营的挑战与破局方向 2026年,企业私域运营压力将持续攀升。一方面,公域流量成本居高不下,传统人工主导的运营模式效率低下;据数据显示,80%的企业因缺乏系统化工具,客户流失率超30%。另一方面…

AI并行化管理将成为2026年最大技术挑战

在19世纪中期的加利福尼亚淘金热中,获益最多的并非那些西行挖掘宝藏的人,而是向他们出售工具的商人。Coder公司CEO Rob Whiteley认为,他所领导的组织正准备成为2020年代AI热潮中的"镐头和铲子"公司。在拉斯维加斯AWS re:Invent大会…

基于GPU加速的大数据多维分析方案

基于GPU加速的大数据多维分析方案:从原理到实践 一、引言:大数据多维分析的“痛”与“解” 1.1 痛点引入:当多维分析遇到大数据 假设你是一家电商公司的数据分析师,需要回答这样的问题:“过去30天,华北地区…

B2B企业GEO服务商选型指南:2025年五家机构全方位评测

摘要 面向B2B企业的GEO选型,关键不在“曝光量”,而在采购决策链渗透与线索质量。本文围绕B2B场景适配、内容与工具闭环、交付方法、效果归因与合规风险四个维度,评测五家机构的能力边界与典型适用条件,并给出合同条款与验收指标建…

十亿级资本涌入具身机器人赛道,特斯拉/微美全息取得进展加速AI机器人量产进程

据新消息,埃隆・马斯克声称,特斯拉(TSLA.US)的擎天柱(Optimus)人形机器人将在短短三年内,超越全球最顶尖的人类外科医生。马斯克称三年后它将实现规模化应用,届时,具备顶尖外科手术水平的擎天柱…

项目进度管理方法实操指南:估算、排期、跟踪、预警一套讲清

B2B 软件项目延期,表面是排期不准,深层原因往往是估算口径不统一、依赖关系没被管理、过程缺少数据反馈、风险预警无法触发决策。本文给出一套可复制的项目进度管理方法:用可验收拆分校准估算,用依赖网与关键路径形成排期约束&…