阿里云函数计算 AgentRun 全新发布,构筑智能体时代的基础设施 - 教程

news/2025/9/30 22:56:07/文章来源:https://www.cnblogs.com/wzzkaifa/p/19121879

image

随着大模型技术的飞速发展,我们正从云原生时代迈向一个全新的 AI 原生应用时代。智能体(Agent)作为能够自主理解、决策并执行任务的全新应用范式,正在重塑软件的定义。然而,在生产环境中规模化落地 Agent 面临着编写效率、安全弹性、运维观测等多重挑战。

今天,云原生应用平台 Serverless 计算负责人杨皓然在云栖大会发表主题演讲“Serverless Agent 基础设施:助力大规模 Agent 部署与运维”。本议题深入介绍了阿里云以函数计算为核心打造的 Agent 基础设施——AgentRun,阐述其如何通过创新的运行时、模型服务、网关及可观测体系,为企业构筑坚实、高效、安全的 Agent 时代基石。

从云原生应用到 AI 原生应用

应用架构的演进史,是一部不断追求极致效率的创新史。从单体应用到以微服务、容器化和 Serverless 为代表的云原生科技,我们将研发重心从繁重的底层运维中解放出来,聚焦于业务创新。

一个个能够自主理解、决策并调用工具完成复杂任务的智能体。就是如今,以大模型和自然语言交互为核心的 AI 原生应用浪潮正汹涌而至。未来的应用将不再是被动等待指令的工具,而

然而,在这条通往智能未来的道路上,生产环境落地 Agent 会在应用生命周期各个阶段面对诸多挑战:

  • 开发阶段的效率问题:企业级 Agent 的构建远不止于 API 调用,它涉及复杂的逻辑编排与设备集成。如何选择合适的创建框架,并与现有业务及研发流程高效匹配,成为首要难题。
  • 部署阶段的安全与弹性问题:Agent 执行代码具有不确定性与流量的动态不可预测性,对运行时的安全隔离与弹性伸缩能力提出了前所未有的高要求。
  • 运维阶段的“黑盒”与“成本失控”难题:Agent 的运行状态、Token 消耗、工具调用路径往往如同一个“黑盒”,导致成本失控与质量评估困难。一套完善的 AI 应用治理与可观测体系不可或缺。

为了解决这些问题,我们以阿里云函数计算 FC 为核心,深度集成日志、网关等云产品,推出了 AgentRun——一个专为 Agent 而生的集成基础设施平台。

AgentRun:专为 Agent 而生的一站式基础设施

AgentRun 旨在为 Agent 应用生命周期的各个阶段提供全面支持,其核心能力围绕三大层面构建:

深度解析 AgentRun 核心引擎

AgentRun 的强大能力,源于其四大核心引擎的协同工作。

智能体运行时与云沙箱:Agent 的心脏

基于函数计算构建的智能体运行时,是 AgentRun 的核心。它提供了一个轻量灵活、安全隔离、极致弹性且成本精益的执行环境。

此外,运行时内置了开箱即用的代码解释器和浏览器沙箱等应用,无论是简单的 Agent 还是复杂的链式 Agent,AgentRun 都能获得统一、高效的执行环境。

模型运行时:领域模型托管更弹性、低成本

Agent 任务常需调用意图识别、文生图、文生语音等领域模型。AgentRun 基于函数计算给予的模型运行时,为这类小参数模型提供了更具弹性和成本效益的托管方案。

image

其核心是一套请求感知调度引擎,处理流程如下:

  1. 当一个推理请求到达函数网关后,我们的调度引擎。它会实时追踪请求处理和集群 GPU 实例的负载情况。

  2. 引擎会根据上述信息做出决策:

    • ‘热’的。就是路径 ①:优先运用那些已经处于活跃状态的实例。这是最高效的方式,保证最低延迟,因为实例
    • Serverless 的一大痛点。但通过我们的快照恢复等技巧,我们将这个唤醒时间压缩到了毫秒级!这意味着我们用较低的成本,实现了百倍的启动加速,能够满足延时敏感的在线业务要求。就是路径 ②:快速唤醒那些暂时闲置但已预热的实例。大家知道,冷启动
    • 路径 ③:弹性补充那些需要从零开始的冷启动实例,以应对后续的流量增长。

这套机制在实际业务场景中效果很好:

  • 在请求感知调度下,我们成功地将 AI 应用的 RT 抖动减少了 80%,大幅提升了用户体验和系统稳定性。
  • 通过毫秒级闲置实例唤醒,我们实现了百倍的启动加速,既保证了 AI 算力的刚性交付,又让客户弹性运用算力资源,大幅降低成本。
  • 通过算力解耦工艺,我们能为客户提供更细粒度的 CPU 和 GPU 组合,让小参数的领域模型资源使用更经济高效。这使得企业能够平均降低 40% 的 GPU 成本。

AgentRun 模型运行时,正是通过这些技术创新,让领域模型推理既高效,又经济,真正实现弹性和成本的最佳平衡。

AI 网关:企业 AI 能力的治理中心

AI 网关不仅是流量入口,更是解决模型多样性、安全合规、开发效率与成本优化三大治理难题的核心。

AI 网关为企业提供高可用、零信任、高性能的全面保障,大模型调用成功率能提升到 99.9% 以上。

AgentRun 可观测:攻克 Agent “黑盒”难题

为解决 Agent“用起来、用得省、用得好”的朴素诉求,AgentRun 构建了强大的可观测能力。

  • 端到端链路追踪:通过标准可观测协议,将用户请求经过的所有组件(网关、模型应用、向量数据库等)串联起来,构建快速的难题定位。
  • 全栈数据关联分析:构建全栈可观测信息平台,将链路、指标(如应用层 RT 与底层 GPU 利用率)等数据进行关联分析,精准判断故障根源。
  • 统一日志存储与分析:提供统一的日志能力,记录每次调用的输入输出,为 AI 应用质量的量化评估与持续优化提供数据基础。

实践的证明:AgentRun 的落地实践

AgentRun 的能力已在多个大规模真实业务场景中得到验证:

新的技术浪潮已经到来。未来的核心竞争力,将不再仅仅是模型本身,而是高效、安全、大规模地部署和管理 Agent 这一全新数字劳动力的能力。AgentRun 的使命,正是成为 AI 原生时代不可或缺的“水电煤”基础设施,为企业的智能化转型铺平道路,让每一个创新的想法都能在这条高速公路上尽情驰骋。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/923321.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

四川省建设厅官方网站贵州企业网站建设价格

文章目录 1 问题描述2 验证2.1 验证猜想12.2 验证猜想2 3 结论4 mysql 为什么这么设计呢? 1 问题描述 创建一张表t,插入一行数据 mysql> CREATE TABLE t ( id int(11) NOT NULL primary key auto_increment, a int(11) DEFAULT NULL ) ENGINEInnoDB…

【Rust GUI开发入门】编写一个本地音乐播放器(10. 拼装UI组件) - Jordan

本系列教程对应的代码已开源在 Github zeedle 将前文写的零散的UI组件(歌曲列表/播放控制面板/歌词面板/设置面板)拼装起来,组成最终的音乐播放器UI,用TabWidget分成多标签页,每一个标签页分担不同的功能:export…

优易官方网站wordpress+快讯

Microsoft Visio 参与者 [actor] - 人的形状图标 1. 更多形状 -> 搜索形状2. 参与者References 1. 更多形状 -> 搜索形状 2. 参与者 References [1] Yongqiang Cheng, https://yongqiang.blog.csdn.net/

破解 Pycharm

破解 Pycharm破解工具:下载链接: https://pan.baidu.com/s/1C4BB55LXPxW4s9lZlFt4FA?pwd=s5jc 提取码: s5jc 破解完成后,这个目录依然不能删除,否则破解失效。所以可将该目录保存至一个很少打开的位置。 先执行…

个人网站申请备案iis7.5 没有默认网站

当我们在浏览器中输入一个URL并按下回车键时,背后其实发生了一系列的复杂过程。这个过程涉及到了网络协议、服务器处理、数据传输等多个环节。下面,我们将详细解析这一过程。 一、URL解析 当我们在浏览器中输入URL并回车后,浏览器首先会进行…

织梦网站地图底部漯河优惠网站建设价格

04数组矩阵 顺时针打印二维数组 0所在行列清零 z字形打印二维数组 找出边界为1的最大子方针 返回子数组最大累加和 子矩阵最大累加和 矩阵运算 顺时针打印二维数组 int[][] arr {{1,2,3,4},{5,6,7,8},{9,10,11,12},{13,14,15,16},{17,18,19,20}};int r 0;int c 0;int…

网站的服务费账怎么做手表网站欧米茄

https://blog.csdn.net/hanhanwanghaha宝藏女孩 欢迎您的关注! 欢迎关注微信公众号:宝藏女孩的成长日记 如有转载,请注明出处(如不注明,盗者必究) 目录一、概念二、带权路径长度三、树的带权路径长度四、举…

网站域名怎么缴费深圳有多少互联网公司

算术平均数(average)是一组数据相加后除以数据的个数而得到的结果,是度量数据水平的常用统计量,在参数估计和假设检验中经常用到。比如:用职工平均工资来衡量职工工资的一般水平,用平均体重来观察某一人群体…

基于php的家具公司网站学设计师需要学历吗

俗话说“民以食为天”,吃饭一向是国人的头等大事,餐饮业也是经济的强劲助推力。新世纪以来,餐饮业不断讲述着热辣滚烫的商业故事。 2006年,拥有“必胜客”、“肯德基”等品牌的餐饮巨头百胜集团,组织两百多名区域经理…

CAP 8.4 版本发布通告

前言 今天,我们很高兴宣布 CAP 发布 8.4 版本正式版。从 8.3.0 版本以来,我们陆续发布了 5 个小版本,在这些版本中我们主要专注于提升系统性能、增强 Dashboard 功能、改进存储提供程序支持,并修复了一系列已知问题…

免费名片在线设计网站小程序外包公司发展前景

目前开发命名规范基本都遵循驼峰命名法,如:userName。我也不将这个规范的特性了,大家都明白。接下来进入正题,如何在python中取一个好名字,让你能更好的见名知意呢?1.元组(Tuple)类型变量命名在python中Tup…

【Leetcode】随笔 - 详解

【Leetcode】随笔 - 详解pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", &q…

STM32 智能垃圾桶项目笔记(一):超声波模块(HC-SR04)原理与驱动实现 - 教程

STM32 智能垃圾桶项目笔记(一):超声波模块(HC-SR04)原理与驱动实现 - 教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-f…

DevEco Studio 编辑器的使用 - 实践

DevEco Studio 编辑器的使用 - 实践pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco…

docker安装MySQL8.0.25的坑

一、搜索拉取镜像 docker search mysql docker pull mysql #不写版本号 默认拉取最新版本 docker pull mysql:8.0.25 #写版本号,则拉取确定的版本二、查看镜像 docker images三、启动镜像 docker run -d --name mysql…

Powershell维护系统管理任务(五)

Powershell维护系统管理任务目录维护系统管理任务管理 AD 域服务管理组和组成员身份管理组创建新组管理组成员身份管理计算机帐户新建计算机帐户修复计算机账户的信任关系账户与设备管理cmdlet的区别管理组织单位和 AD…

百度的网站名山东省建设项目监理协会网站

前言: pad 是每个 element实例 都有的,是 elemenet 之间沟通的代理人,没有 pad 的 element 没法于其他element交流。 考虑到gstreamer存在继承体系,那么如果继承类element不在init函数里创建pad,那么在gst_element_l…

软件测试工程师面试刷题:简单JAVA算法题以及解法

软件测试工程师面试刷题:简单JAVA算法题以及解法找不同给定两个字符串 s 和 t ,它们只包含小写字母。 字符串 t 由字符串 s 随机重排,然后在随机位置添加一个字母。 请找出在 t 中被添加的字母。示例 1: 输入:s =…

济南专业的设计网站免费网站建设 百度收录

NVIDIA Corporation 在 GitHub 的官方主页 References https://github.com/NVIDIA References [1] Yongqiang Cheng, https://yongqiang.blog.csdn.net/

蚌埠做网站有哪些公司买个域名

本文主要向大家详细介绍了jQuery的绑定事件和移除事件的使用方法和示例分享,这里推荐给有需要的小伙伴们参考下。有时候事件执行完了,想取消事件的效果可以通过一定的办法来处理。比如bind()(绑定事件)和unbind()(移除通过bind()方法添加的事件)方法来移…