加速智能体开发:从 Serverless 运行时到 Serverless AI 运行时

news/2025/10/23 14:29:37/文章来源:https://www.cnblogs.com/Serverless/p/19160489

本文整理自 2025 云栖大会,阿里云智能集团产品专家,洪晓龙演讲议题《函数计算:AI 时代的最佳运行时》

在云计算与人工智能深度融合的背景下,Serverless 技术作为云原生架构的集大成者,正加速向AI原生架构演进。阿里云函数计算(FC)率先提出并实践“Serverless AI 运行时”概念,通过技术创新与生态联动,为智能体(Agent)开发提供高效、安全、低成本的基础设施支持。本文从技术演进路径、核心能力及未来展望三方面解析 Serverless AI 的突破性价值。

一、从 Serverless 到 Serverless AI :技术演进的必然选择

在 AI 时代,Serverless 正经历从 Serverless 到 Serverless AI 的进化。这一转变是由于 AI 应用对基础设施的新要求,包括围绕 Agent 为中心的开发范式变化、状态持久化需求、任务驱动协作方式以及容错自愈能力等四个主要方面。AI 原生范式下,Agent 的开发方式从服务化或 API 为中心转向以 Agent 为核心,且要求基础设施支持多样化任务、弹性扩展、数据隔离安全特性及主动任务协同调用方式。

AI 原生应用开发的四大核心需求

  1. Agent 中心化开发范式
    • 传统 API 驱动模式已无法满足 Agent 自主决策、主动执行任务的需求。AI 原生开发需围绕 Agent 生命周期设计,强调任务驱动协作而非被动响应。
  2. 状态持久化支持
    • Agent 需保存对话记忆、人格设定等状态信息,要求基础设施原生支持状态管理,避免依赖外部存储组件。
  3. 动态任务执行能力
    • Agent 需执行代码、浏览器操作、工具调用等多样化任务,运行时需具备轻量化、强扩展性,适配不可预测的流量模式。
  4. 容错与自愈机制
    • 面对大模型生成代码的不确定性,需从防御性编程转向运行时自愈能力,降低安全风险对开发效率的影响。

技术架构对比:Serverless vs. 传统容器/虚拟机

AI 原生架构的演进主要有两条路径,一是通过虚拟机/容器运行时逐渐演变为以智能体运行时为代表的 AI 原生架构;二是直接从 Serverless 运行时进化为以智能体运行时为代表的 AI 原生架构。

Serverless 架构与 AI 时代需求具有天然契合性,其具备任务类型多样、流量突发性强、数据安全隔离以及轻量级、高弹性等优势,使得 Serverless 架构在状态管理、资源分配和运维方面展现出优势,成为 AI 时代最短的技术进化的路径。

维度 传统架构(容器/虚拟机) Serverless AI 运行时
资源分配 静态资源分配,弹性不足 动态弹性伸缩,按需调用
状态管理 依赖 Redis/DB 等外部组件,跨节点迁移困难 天然支持状态持久化与会话亲和性
调用模式 被动响应式 API 调用 主动规划式任务协同
运维成本 需投入大量人力运维 免运维,零服务器管理

Serverless 架构因其动态弹性、免运维特性,成为 AI 原生架构的最短路径。开发者可专注于业务创新,无需关注基础设施细节。

二、Serverless AI 运行时

作为 AI 时代的最佳运行时,函数计算 FC 业界首推从 Serverless 进化为 Serverless AI,推出三大核心运行时底座:

  1. Serverless 模型运行时:

支持超 20,000 + 热门开源模型一键部署为生产级 API。通过异构算力池、请求感知调度、毫秒级闲置唤醒、1/N 卡切分技术实现实时/准实时推理场景冷启动加速,实现 RT 抖动减少 80%,最高降本 93.75%。

  1. 智能体与工具运行时

首创 Serverless 级会话亲和/隔离架构,通过毫秒级启动和上下文保持大幅提升智能体开发、部署和运行效率,性能超越传统方案 100 倍。

率先推出十万函数、百万实例级别的大规模沙箱服务(如 Code Interpreter API ),并内置 Python/Node.js/Java/PHP/Shell/.NET 等 50 余种多语言环境,支持 OCI 标准镜像,原生兼容 MCP 和 Function Call 协议标准。

这三大运行时均基于函数计算构建,为开发者提供0 运维、极致弹性、成本最优的 AI 原生基础设施,并联动阿里云、通义实验室、魔搭社区等生态,全面加速 AI 应用创新。

Serverless AI 的实践验证与生态联动

1. 魔搭社区:模型托管的标杆案例

  • 应用场景:支持2万个热门模型一键托管,用户无需关注底层集群配置,30秒内生成生产级 API。
  • 技术支撑:依托 Serverless 模型运行时,实现自动弹性伸缩与高可用性。

2. Qwen3 Coder 训练:沙箱环境的高效利用

  • 强化学习:通过函数计算沙箱环境,Qwen3 Coder 的代码生成能力显著提升,无需维护训练集群。
  • 多语言支持:内置运行时环境适配模型生成代码的直接运行需求,零运维、毫秒级计费。

3. 百炼 MCP 市场:工具服务的原子化部署

  • 功能亮点:开发者可通过 Serverless 运行时将工具服务部署为企业级 MCP,支持冷门工具低频调用与热门工具高频响应的灵活适配。

4. 全链路 Serverless 生态联动

  • 产品协同:整合阿里云日志、网关等产品,实现端到端链路追踪、全栈可观测性及精细化成本控制。
  • 开发效率:AI 网关提供多模型协议适配与语义缓存,模型调用成功率提升至99.9%。

三、未来展望:Serverless AI 的无限可能

  1. 智能体应用的普惠化
    • 非技术开发者可通过 Serverless 平台快速构建智能体应用,降低 AI 开发门槛。
  2. 全栈弹性与原子化能力
    • 通过 Serverless AI 运行时,实现从模型、智能体到工具的全链路弹性资源调度与原子化服务编排。
  3. 生态开放与行业落地
    • 推动 Serverless AI 技术标准化,助力企业实现 AI 原生应用规模化落地,覆盖智能座舱、工业自动化等场景。

Serverless AI 运行时的诞生,标志着云计算与 AI 技术的深度耦合。阿里云函数计算通过三大核心技术(请求感知调度、毫秒级唤醒、异构算力切分),为 AI 应用开发提供了免运维、高弹性、低成本的基础设施。随着生态不断完善,Serverless AI 将持续为企业和个人创造更多价值,驱动更多创新应用的诞生。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/944264.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RFSOC学习记录(三)LMK04828时钟配置

rfsoc学习记录第三篇,lmk04828时钟介绍与配置上一篇讲了rf data converter这个ip核整体的时钟结构 以及rfdc的运行机制,在我们实际应用的过程中,还需要在PS端通过配置寄存器的方式启动时钟,而通过TICS PRO这个工具…

设计原则-教程

设计原则软件工程的七大设计原则包括开闭原则、接口隔离原则、里氏替换原则、合成复用原则、迪米特法则(最小知识原则)、单一职责原则、依赖倒置原则。(开口里合最单依) 一 开闭原则 开闭原则(Open Closed Princi…

Failed to start nginx.service: Unit nginx.service not found.

分享一篇nginx安装后,出现:Failed to start nginx.service: Unit nginx.service not found. 我们需要如何解决这个问题 在使用 Nginx 1.26.3 时遇到了 nginx.service找不到的问题。这是因为通过源码编译安装 Nginx 后…

WTAPI框架/微信个人号开发协议

WTAPI框架/微信个人号开发协议、个微协议/微信二次开发/ipad协议/WTAPI框架 WTAPI框架,是一个开发协议,专为开发微信机器人和自动化任务而设计。它允许开发者通过微信公众号接口实现各种功能,包括但不限于关键字回复…

AE/PR插件-Beauty Box v6.0.2 专业视频人像磨皮美颜润肤插件

插件简介 Beauty Box 是一款由Digital Anarchy 出品的专业视频人像磨皮美颜插件,可以智能识别人像肤色,一键磨皮。Beauty Box Video 4.0采用了最畅销,最受好评的皮肤平滑技术,并提供了实时渲染(在某些GPU上)。Be…

2025 年北京紧急 / 北京上门 / 北京防盗门 / 北京密码锁开锁公司推荐:北京锁王开锁有限公司 —— 安全锁具服务的可靠之选

行业背景 随着城市化进程加速与智能家居普及,北京开锁服务需求持续攀升,涵盖住宅、汽车、商铺等多元场景。但市场中仍混杂未经工商注册、公安备案的机构,存在技师资质不明、服务后加价、锁具损坏等乱象,甚至潜藏财…

2025 年封口机厂家推荐:武汉吕工机械,以技术创新驱动包装行业新发展

在当今包装设备行业,封口机作为关键设备,其性能和质量直接影响到产品的包装效果和生产效率。随着市场对包装需求的不断提升,各大封口机厂家纷纷加大研发投入,以满足客户日益多样化的需求。武汉吕工机械有限公司便是…

ubuntu 20.04 安装 maven 3.8.1

一、安装依赖:Java 环境 sudo apt update sudo apt install openjdk-11-jdk -y java -version二、下载 Maven 3.8.1 从 Apache 官网下载对应版本的压缩包: wget https://archive.apache.org/dist/maven/maven-3/3.8.…

SOLIDWORKS不仅是一个学习工具更是一个激发创新思维的平台 - 教程

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

详细介绍:python-poppler - PDF文档处理Python绑定库

详细介绍:python-poppler - PDF文档处理Python绑定库pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas&qu…

火山引擎发布新产品用户研究Agent,并推出数据智能体评测体系

2025年10月16日,火山引擎“FORCE LINK AI创新巡展”在武汉成功举办。作为系列巡展的重要组成部分,本站活动聚焦前沿技术产品能力在区域市场的深化落地,吸引了来自制造、金融、互联网、零售等领域的近千名企业技术负…

pycharm 2025.2.3 安装、授权、使用说明

pycharm 2025.2.3 安装、授权、使用说明从 PyCharm 2025.1 开始,PyCharm Community 和 Professional 将合并为一个统一的产品: PyCharm。 通过此更改,所有用户都可以访问基本功能,无需在不同版本之间切换。 2025年…

DBA必备脚本:一键获得SQL访问的表及对应的索引,可协助快速定位SQL性能瓶颈

我们的文章会在微信公众号IT民工的龙马人生和博客网站( www.htz.pw )同步更新 ,欢迎关注收藏,也欢迎大家转载,但是请在文章开始地方标注文章出处,谢谢! 由于博客中有大量代码,通过页面浏览效果更佳。今天是我们分…

开发微信机器人/个微/WTAPI框架

开发微信机器人/个微/WTAPI框架 通过微信个人号开发协议/实现客户管理功能 WTAPI框架通过微信个人号开发协议805 实现客户管理功能技术点: 使用短时效Token(≤300s)降低封号风险 心跳间隔动态调整(15-45s随机)模…

读书笔记:白话解读Oracle哈希分区

我们的文章会在微信公众号IT民工的龙马人生和博客网站( www.htz.pw )同步更新 ,欢迎关注收藏,也欢迎大家转载,但是请在文章开始地方标注文章出处,谢谢! 由于博客中有大量代码,通过页面浏览效果更佳。本文为个人学…

GIT DUBUG 变量设置

GIT_CURL_VERBOSE=1 GIT_TRACE=1

九种类图归纳总结

在面向对象设计与软件开发中,UML(统一建模语言)类图是描述系统静态结构的核心工具,而类与类之间的关系则是类图的灵魂。这些关系不仅定义了对象之间的交互规则,更决定了系统的架构逻辑与可扩展性。UML 类图中的关…

git ssh 已配置公钥,但仍然无法连接成功 - lay

背景 在Raspberry Pi 上通过 git clone ssh://xxx@<host_name>:29418/<REPOSITORY_NAME.git> 克隆 Gerrit 仓库时失败,报错 Permission denied (publickey); 但使用 git@ 格式(如 git clone git@<ho…

2025年10月国内北京黄金回收公司全景解析报告,基于专业测评的技术、性能及市场优势深度分析

随着黄金市场的持续活跃,黄金回收行业逐渐成为消费者关注的焦点。为帮助用户精准选择可靠的服务商,本文基于企业资质、检测技术、服务透明度、客户口碑等维度,对北京地区主流黄金回收公司进行深度调研,并结合行业数…