部署AI智能体的七个实战经验教训

部署AI智能体并非传统的软件发布,需要在实际操作中投入大量工作和规划才能让这些工具发挥生产力。顶层策略包括给予智能体一定的自由度,但不能过度放任,同时还需要重新思考传统的投资回报率衡量标准。

有效的AI开发和管理需要在控制、投资、治理和设计方面做出明智的选择。麻省理工学院斯隆管理学院和波士顿咨询集团的最新研究指出了AI智能体开发者和支持者需要注意的"矛盾"问题。

在整个行业中,人们普遍认为智能体需要超越传统软件开发的新考虑因素。在这个过程中,正在学习新的经验教训。行业领导者分享了他们在迈向智能体AI未来过程中的一些经验。

经验一:自信不等于准确

思科首席工程师Nik Kale领导了一个团队,为超过100,000名用户提供专家级技术指导的智能体。他表示:"自信不等于准确。"早期版本的智能体"可能会自信但错误地回应,这要求我们大量投资于通过检索和结构化知识来支撑回应。"

Kale学到的一个重要教训是"治理不能后补"。"当监督和政策控制添加得太晚时,系统往往缺乏支持它们的架构钩子,迫使痛苦的暂停或重新设计。"

从长远来看,信任会加速建立。Kale说:"一旦系统表现良好,人类的审查就会减少。如果边界不明确,这就是范围蔓延和意外自主性可能出现的时候。"

Kale敦促AI智能体支持者"根据可逆性而非模型自信度授予自主权。跨多个领域的不可逆操作应该始终有人类监督,无论系统看起来多么自信。"可观察性也是关键,Kale说:"能够看到决策是如何达成的,与决策本身同样重要。"

经验二:从狭窄领域开始

Atomic Gravity首席执行官Tolga Tarhan说:"对于智能体,我们有意从狭窄领域开始。我们部署的大多数智能体都限定在单一领域内,具有明确的防护栏和可衡量的结果。这可能是工程副驾驶、运营助手,或为高管综合复杂数据集的智能体。"

经验三:数据质量是核心

营销机构Duanex的首席执行官Oleg Danyliuk构建了一个智能体来自动验证网站访客的潜在客户。他说:"AI在有质量数据支撑时效果很好。在我们的例子中,为了理解潜在客户对我们是否有趣,我们需要获得尽可能多的数据,最复杂的是获取社交网络数据,因为它们大多不可访问抓取。这就是为什么我们必须实施几个变通方法,只获取数据的公开部分。"

Tarhan同意:"数据质量是首要问题。模型的表现只能和它们获得的信息一样好。"

经验四:提前定义成功

Tarhan说:"提前定义成功。记录一切。让人类在循环中的时间比感觉必要的更长。早期投资于可观察性和治理。当做得对时,AI智能体可以带来变革。当匆忙推进时,它们就变成了昂贵的演示。区别在于纪律性。"Tarhan的团队将智能体视为具有路线图、反馈循环和持续迭代的项目,"而不是科学实验"。

经验五:采用AgentOps方法

Info-Tech研究集团首席研究总监Martin Bufi说:"AI智能体不仅仅依靠模型能力就能成功。"他的团队为企业级功能设计和开发了AI智能体系统,包括财务分析、合规验证和文档处理。帮助这些项目成功的是采用"AgentOps"(智能体运营),专注于管理整个智能体生命周期。

Bufi建议"使用多个专门的智能体来执行分析、验证、路由或通信等功能",而不是构建单一的全能智能体。此外,Bufi的团队寻求让这些智能体团队模仿人类团队的运作方式,"通过显式的编排模式——用于并行工作的hub-and-spoke,或在深入行动之前必须建立意图和信心的顺序管道。"

经验六:上下文管理是关键挑战

Confluent的AI负责人Sean Falconer在反思他构建的个人智能体时说:"即使对于相对有限的单用户智能体,上下文管理也是一个重大障碍,如果处理不当可能导致重大问题。"

"当智能体循环使用工具和迭代交互时,上下文窗口会快速填满。虽然较旧的数据点可能失去相关性,但模型并不总是隐式地优先处理正确的信息。"

为了保持高质量和一致的输出,开发者"花费不成比例的时间来优化如何修剪、总结和注入上下文,以便智能体不会失去原始目标的主线。"

经验七:从第一天就考虑适应性

Falconer解释:"从第一天就为适应性而设计。确保你的AI投资是灵活的并且适当抽象。避免供应商或模型锁定,这样你就可以在下一波创新浪潮到来时快速调整。"

Q&A

Q1:部署AI智能体与传统软件部署有什么不同?

A:部署AI智能体需要更多的工作和规划,不能简单套用传统软件发布模式。需要给予智能体适度的自由度但不能过度放任,还要重新思考投资回报率的衡量标准,在控制、投资、治理和设计方面都需要做出与传统软件不同的考虑。

Q2:为什么说AI智能体的自信不等于准确?

A:思科的实践表明,早期版本的智能体可能会自信但错误地回应问题。这要求开发者大量投资于通过检索和结构化知识来支撑智能体的回应,确保其准确性。因此应该根据可逆性而非模型自信度来授予智能体自主权。

Q3:AgentOps是什么?为什么重要?

A:AgentOps(智能体运营)是专注于管理整个智能体生命周期的方法。它强调使用多个专门的智能体来执行不同功能,而不是构建单一的全能智能体,让智能体团队模仿人类团队的运作方式,通过显式的编排模式来协同工作。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1160316.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

无线网络仿真:6G网络仿真_(6).MAC层仿真

MAC层仿真 1. MAC层概述 1.1 MAC层的基本功能 在无线网络中,介质访问控制(Medium Access Control, MAC)层负责管理无线资源的分配,确保多个设备能够高效、有序地共享同一无线媒介。MAC层的主要功能包括: 帧的封装与解封…

CrowdStrike以4亿美元收购浏览器安全公司Seraphic

CrowdStrike Holdings Inc. 正在收购Seraphic Security Ltd.,这是一家帮助企业保护员工浏览器免受在线威胁的初创公司。两家公司今天宣布了这项交易,但没有披露财务条款,不过Calcalist网站估计收购金额为4亿美元。Seraphic在加利福尼亚州帕洛…

无线网络仿真:6G网络仿真_(7).网络层仿真

网络层仿真 1. 网络层的基本概念 网络层是无线网络仿真中一个非常重要的层次,它负责将上层的传输数据包从源节点路由到目的节点。网络层的主要功能包括路由选择、拥塞控制、流量管理等。在6G网络仿真中,网络层仿真不仅要考虑传统无线网络的特性&#xff…

谷歌重新拥抱被冷落的JPEG XL图像格式

谷歌已将JPEG XL(JXL)图像格式支持添加到开源Chromium代码库中,这一决定逆转了2022年放弃该技术的立场。最近的一次代码提交集成并启用了JXL解码器,这意味着未来发布的Google Chrome和其他基于Chromium的浏览器将包含处理和显示JX…

直接画圆或输入半径(关键字和选择状态并列)

if (pointResult.Status PromptStatus.Keyword) else if (pointResult.Status PromptStatus.OK){// 用户直接指定了点,使用默认半径画圆CreateCircle(db, ed, pointResult.Value, radius);}else{// 用户取消return;}public static void DrawCircleWithDirectOptio…

内存短缺意外带来好处:AI PC炒作降温

内存价格飙升对今年想要购买、组装或升级电脑的人来说是坏消息,但对那些厌倦了所谓"AI PC"宣传的人来说,这可能是个好消息。据Ars Technica报道,由生成式AI热潮推动的数据中心需求不断增长,导致内存和闪存芯片短缺&…

CAD倒圆角——CAD自带倒圆角 VS c#重写的倒圆角

经测试CAD2024中闭合多段线倒圆角(半径1),效果如下:对比发现,这种情况CAD自身命令F P 选择多段线生成的倒圆角出现了bug, 通过重写倒圆角算法避免了此种bug出现。

急刹事件作为道路风险评估新指标研究

我们通过分析Android Auto收集的急刹事件(HBEs)与实际道路事故率之间的关系,确立了两者之间的正相关性。研究证实,急刹事件频率较高的道路段确实具有显著更高的事故风险,这表明此类事件可以作为道路安全评估的前瞻性指…

AI自适应降噪耳机改变听觉体验

在AI技术快速融入智能手机、笔记本电脑、平板电脑和耳机的竞赛中,最引人注目的AI功能通常会受到最多关注。当耳机使用AI进行实时翻译服务或支持免提访问生成式AI聊天机器人时,你会明显感知到。但还有一种你的耳机使用AI的方式,虽然不那么令人…

RS485 双串口通信 + LCD 实时显示(DMA版)

目录 一、前言二、DMA 通信核心原理简述三、CubeMX 的 DMA 串口配置四、FreeRTOS DMA 收发任务代码开发五、总结六、结尾 一、前言 前文我们已经完成了串口 RS485 通信的查询方式与中断方式开发,两种方式各有适配场景。本次笔记将在此基础上,讲解串口…

板凳----------(枯藤 )vs2026+win10(第六章-6)

《伤寒论》OCR 读书笔记项目的清晰小结,涵盖 安装步骤 代码调试关键点,方便复盘、备份或分享: 🧩 一、整体目标 将扫描版 PDF《伤寒论》通过 OCR 自动识别 → 提取方剂组成 → 生成结构化 Markdown 笔记(含口诀、比例…

“AI 电影,你敢买票吗?”——《团圆令》与《红孩儿》开启国产动画新赛道

随着人工智能(AIGC)技术的迅猛发展,国产动画电影正经历着一次颠覆性的变革。2025年12月20日,中国首部院线AIGC动画电影《团圆令》在北京举行点映礼,随后《红孩儿:赤焰之心》在上海松江举行开机仪式&#xf…

2026年计算机领域重点支持方向(参考)

截至2026年初,计算机及相关技术领域在中国正处于“十四五”收官、“十五五”开启的关键节点。一、2026年国家政策重点支持方向 ✅ 1. 人工智能(AI)与大模型 政策依据:《新一代人工智能发展规划》持续深化;2026年中央经…

新年氛围营造:新疆/西藏/甘肃/青海购物中心美陈设计公司盘点

当新年的脚步踏遍西北大地,新疆的丝路驼铃、西藏的雪域风情、甘肃的敦煌文脉、青海的河湟古韵,都在购物中心这个城市核心场景中寻找新的表达。作为节日氛围营造的关键载体,美陈设计早已跳出 “静态装饰” 的局限,成为融合地域文化…

压测 把自己 压进去了

凌晨一点,城中村的出租屋里,只有电脑屏幕的蓝光映着小李的脸。作为一名自由后端开发者,他不用受公司制度约束,日常接些接口开发、bug修复的散活,大把空闲时间都耗在了钻研技术上——而压测各类接口,成了他藏…

全网最全9个AI论文网站,专科生毕业论文轻松搞定!

全网最全9个AI论文网站,专科生毕业论文轻松搞定! AI 工具如何助力论文写作,让专科生轻松应对毕业挑战 在当前的学术环境中,越来越多的专科生开始借助 AI 工具来提升论文写作效率。尤其是那些对写作技巧不熟悉、时间紧张的学生来说…

《创业之路》-852- 价值投资者的七步法:如何系统地看懂一个企业

价值投资者要真正“看懂一个企业”,不仅仅是看财务报表或估值数字,而是要深入理解企业的本质、护城河、管理层、商业模式和长期前景。正如巴菲特所说:“用合理的价格买入一家伟大的企业,远胜于用便宜的价格买入一家平庸的企业。”…

《创业之路》-855- 商业模式案例分析 - 中兴通讯

商业模式案例分析:中兴通讯(ZTE Corporation)中兴通讯(ZTE)成立于1985年,是中国领先的综合通信技术与解决方案提供商之一,也是全球主要的电信设备制造商和智能终端供应商。作为中国信息通信产业…

Vue3:泛型类型声明 vs 运行时选项声明 语法对比

Vue 3 提供了两种 props 声明方式&#xff1a;泛型类型声明和运行时选项声明。泛型类型声明&#xff08;defineProps<{prop:Type}>()&#xff09;在编译时进行类型检查&#xff0c;完全支持 TypeScript&#xff0c;适合新项目和追求类型安全的场景。运行时选项声明&#…

《创业之路》-857- 商业模式案例分析:阿里、百度、腾讯、字节、滴滴、美团、京东、拼多多 全面对比

商业模式案例分析&#xff1a;阿里、百度、腾讯、字节、滴滴、美团、京东、拼多多 全面对比在中国数字经济的版图中&#xff0c;阿里巴巴、百度、腾讯、字节跳动、滴滴出行、美团、京东、拼多多是八家最具代表性的科技企业。它们虽同属“互联网”时代产物&#xff0c;但因创始基…