聚焦 AI 应用基础设施,云栖大会 Serverless AI 全回顾

2025 年 9 月 26 日,为期三天的云栖大会在杭州云栖小镇圆满闭幕。随着大模型技术的飞速发展,我们正从云原生时代迈向一个全新的 AI 原生应用时代。为了解决企业在 AI 应用落地中面临的高成本、高复杂度和高风险等核心挑战,阿里云基于函数计算 FC 发布一系列重磅服务。本文将对云栖大会期间 Serverless+AI 基础设施相关内容进行全面总结。

函数计算 AgentRun 全新发布

image

图为吴结生,阿里云智能集团弹性计算产品线负责人、存储产品线负责人,发表演讲《AI 驱动,阿里云基础设施的创新与发展》

聚焦企业级 Agent 开发场景,阿里云重磅发布 以函数计算为核心打造的 Agent 基础设施——AgentRun, 通过创新的运行时、模型服务、网关及可观测体系,为企业构筑坚实、高效、安全的 Agent 时代基石。AgentRun 采用 Serverless 架构,真正实现零运维负担,支持毫秒级冷启动的极致弹性,更能降低 60% 的平均 TCO 成本。

作为完整强大的 Agent 运行时,AgentRun 首创 Serverless 级会话亲和/隔离架构,通过毫秒级启动和上下文保持,大幅提升智能体开发、部署和运行效率,性能超越传统方案 100 倍,并率先推出支持十万函数百万实例级别的沙箱服务;全新的 AI 应用全栈可观测能力,确保每一次调用、每一个决策都可追溯、可评估。AgentRun 极大地缩短了产品从构建到上市的时间,让企业和开发者把更多精力聚焦在业务逻辑和产品打磨上。

image

图为周靖人,阿里云智能集团首席技术官,演讲《年度云与 AI 全栈技术发布》

基于函数计算构建的智能体运行时,是 AgentRun 的核心。它提供了一个轻量灵活、安全隔离、极致弹性且成本精益的执行环境。

  • 安全隔离: 运行时的第一原则。 我们采用自研的“袋鼠安全容器”,它具备虚拟机的隔离强度,却拥有容器级的百毫秒启动速度。结合存储、网络的多维度多租户隔离设计,确保 Agent 可在安全的环境中执行任意代码。
  • 极致弹性: 应对不确定负载的关键。 AgentRun 创新地将实例管理做成了数据平面,使其弹性能力无单点瓶颈,可随集群规模无限水平扩展。结合专为弹性优化的网络架构,实例可在百毫秒内启动并访问 VPC 内的任何资源,当前已具备单集群支持百万规模的智能体运行时和沙箱实例,单个智能体服务支持百万 QPS 的服务能力。
  • 精益成本: 技术普惠的基石。 我们首创了按实例“忙/闲”状态独立计费的模式。当 Agent 等待模型或工具响应时,实例处于闲置状态,算力免费,仅收取极低的内存费用。该模式完美契合 Agent 的工作流,平均可为企业降低 60% TCO。

此外,运行时内置了开箱即用的代码解释器和浏览器沙箱等工具,无论是简单的 Agent 还是复杂的链式 Agent,AgentRun 都能获得统一、高效的执行环境。

image

图为蒋江伟,阿里巴巴集团合伙人、阿里云智能集团基础设施事业部负责人,演讲《AI 驱动下的阿里云基础设施:技术创新与产品演进》

AgentRun 旨在为 Agent 应用生命周期的各个阶段提供全面支持,其核心能力围绕三大层面构建:

  1. 开发层面: 框架兼容与深度集成。 AgentRun 与开发框架无关,任何框架构建的 Agent 都可以平滑运行。并且我们针对流行框架进行了深度集成。用户可能够根据自身需求,选择最适合的工具和框架,无论是基于模板快速搭建,还是深度定制,都能事半功倍。
  2. 运维层面: 全面的 AI 应用治理与可观测体系。 从统一的模型代理网关,到 AI 全栈监控与端到端链路追踪,AgentRun 帮助客户清晰洞察 Agent 的每一个行为与每一笔消耗,实现精细化的成本控制与质量优化。
  3. 部署层面: 提供安全、弹性、低成本的运行底座, 针对 Agent 应用负载特点,AgentRun 提供了深度优化的运行时,确保 Agent 在安全隔离的环境中高效、弹性地运行。

从 Serverless 到 Serverless AI**

函数计算发布 3 大运行时底座,全面加速 AI 应用创新

image

图为洪晓龙,阿里云智能集团产品专家,演讲《函数计算:AI 时代的最佳运行时》

作为 AI 时代的最佳运行时,函数计算 FC 业界首推从 Serverless 进化为 Serverless AI,推出三大核心运行时底座:

1. Serverless 模型运行时: 支持超 20,000 + 热门开源模型一键部署为生产级 API。通过异构算力池、请求感知调度、毫秒级闲置唤醒、1/N 卡切分技术实现实时/准实时推理场景冷启动加速,实现 RT 抖动减少 80%,最高降本 93.75%。
2. Serverless 智能体运行时:
首创 Serverless 级会话亲和/隔离架构,通过毫秒级启动和上下文保持大幅提升智能体开发、部署和运行效率,性能超越传统方案 100 倍。
3. Serverless 工具运行时: 率先推出十万函数、百万实例级别的大规模沙箱服务(如 Code Interpreter API),并内置 Python/Node.js/Java/PHP/Shell/.NET 等 50 余种多语言环境,支持 OCI 标准镜像,原生兼容 MCP 和 Function Call 协议标准。

这三大运行时均基于函数计算构建,为开发者提供 0 运维、极致弹性、成本最优的 AI 原生基础设施,并联动阿里云、通义实验室、魔搭社区等生态,全面加速 AI 应用创新。

FunctionAI 聚焦 4 大模块,破解 AI 开发核心难题

image

图为刘宇,阿里云智能集团产品专家,演讲《函数计算发布 FunctionAl:serverless Al 原生应用基础设施》

阿里云函数计算全新发布 FunctionAI,基于 Serverless 架构的企业级 AI 应用基础设施平台,旨在解决AI开发中技术门槛高、运维复杂及成本昂贵等挑战。

其核心模块包括:

  • AgentRun 智能开发平台 (核心创新):提供完整的Agent Runtime执行环境、基于 Session 级别的安全沙箱隔离机制、统一的 MCP/Function Call工具生态接入标准,以及支持 20+大语言模型的智能路由与治理系统,采用按需计费模式实现成本优化,支持实例的毫秒级弹性扩缩容和百万级并发处理能力。
  • 模型服务:支持 200+ 主流模型一键 Serverless 化部署,实现模型到 API 的无缝转换。
  • 多模态创作平台:深度集成 ComfyUI、StableDiffusion 等工具链,提供从文生图到音视频的全模态生AI 内容成能力。
  • Function Q 智能助手:专业的函数计算智能助手,集成了基于大模型的代码自动生成、智能运维诊断和系统架构设计三大核心能力,显著提升 Serverless 应用的开发效率。整体技术栈基于函数计算FC、API网关、RocketMQ、SLS等阿里云成熟基础服务构建,遵循云原生设计原则,提供企业级的高可用性、安全性和可观测性保障。

FunctionAI 通过轻量化推理引擎、智能 AI 网关和全生命周期 Serverless 管理三大核心能力,显著提升资源利用率并保障多租户隔离。平台基于函数计算FC、API 网关等成熟服务构建,为企业提供高可用、高安全、成本优化的AI原生基础设施。

Serverless AI 原生应用架构聚焦 AI 业务难题

image

图为赵世振,阿里云智能集团解决方案工程师,演讲《多模态世界的 Serverless AI 实践之路》

Serverless AI原生应用架构」理念,旨在解决企业 AI 业务面临的“三高”问题(高成本、高复杂度、高风险)。

从基础设施到业务接入层的全链路重构,AI原生架构需满足算力稳定高效、系统高可用及安全管控等核心需求,尤其在 GPU 资源成本、供应保障、多可用区容灾、限流与鉴权等方面提供生产级能力。基于 Serverless 的架构新范式,利用函数计算FC 提供灵活的 GPU 算力及一键部署模板,结合 SAE、AI 网关实现全栈 Serverless 部署、端到端观测、双层安全与简易使用体验。满帮集团的落地案例显示,该架构显著提升了 AI 应用的规模与业务表现,更是验证了架构对业务的赋能价值。让架构为业务赋能,让 AI 为世界创造更多可能。”

SAE:从传统应用到 AI 应用的一站式托管

image

图为张凤婷,阿里云智能集团高级产品专家,演讲《Serverless 应用引擎 SAE:从传统应用到 AI 应用的一站式托管》

阿里云 Serverless 应用引擎 SAE(以下简称 SAE) 聚焦“零改造、全托管”模式,是一个商业化 8 年、成熟兼容 K8s 的容器平台,并连续入选 Forrester(2023) 与 Gartner(2025) 全球 Serverless 领域领导者象限。AI 时代,SAE 赋能传统应用加速AI创新,帮助传统应用实现“简(免运维)、稳(高可用)、省(降成本)”的升级,解决运维难题,同时让 AI 应用跨越技术复杂性、稳定性与成本三大鸿沟,实现从探索到高效落地。SAE 正在成为企业 AI 时代的基础设施底座,让企业能轻松构建、稳定运行并高效迭代其 AI 应用。

携手客户,Serverless+AI 共赢

吉利汽车研究院

image

图为谢东,吉利汽车研究院-人工智能中心智算开发部部长,演讲《吉利汽车 AI 座舱业务落地实践:轻量化架构,智能极致体验——吉利汽车携手函数计算打造新一代 AI 业务推理引擎》

吉利汽车研究院携手阿里云团队及合作伙伴打造的吉利汽车全新一代 AI 座舱推理服务已于今年 6 月份上车,刚刚上市的吉利银河 M9 车型进行深度搭载。

阿里云基于函数计算 FC 提供面向 Serverless 化、高可用、高性能和低时延的算力集群。同时阿里云协助吉利汽车一起梳理优化座舱服务的全链路稳定性建设、模型工程化优化、模型推理高可用、模型推理加速等。基于推理业务的 C 端属性,函数计算FC 的按量使用模式在保障用户使用体验不变的情况下,相比 IaaS 资源供给,成本优化高达 33% 。同时阿里云函数计算团队会保障算力集群的高可用和 GPU 算力的稳定供给,吉利汽车研究院的业务方专注模型服务,运维方专注业务高可用建设。

深势科技

image

图为丁钊翰 ,深势科技 AI 研发负责人,演讲《阿里云 FC 助力深势 AI4S Agent 业务发展》

深势科技与阿里云团队深度合作,打造了 AI for Science 的 MCP 市场,构建按需使用的新时代 Science 基建,把自身的工具,社区共建的工具,读文献、做计算、自动化做实验的工具,与先进的智能体设施进行通用的接口对接,打造 AI 智能体时代面向科学发现的智能系统。

深势科技利用函数计算 FC 提供的环境的强隔离、高可用性、状态的保留、完整的可观测的能力,快速实现了 AI for Science 的 Agent,更好的帮助科研人员做到开箱即用,节省科研人员宝贵的精力,实现了快速对实验进行规划、确认、调度、执行及生成报告等一系列流程。同时基于 AI 智能体可以批量设计数千个实验同时进行,并快速验证科学猜想,使效率得到成千上万倍的提升,以智能体时代的新基建真正为科学技术的发展按下加速键。

中国小商品城集团

image

图为张骞, 浙江中国小商品城集团股份有限公司架构师,演讲《中国小商品城 Serverless AI 实践之路:从 Serverless AI 土壤里的生长出来的多模态Agent》

中国小商品城在 AI 时代的战略布局与技术实践,聚焦于构建基于 Serverless 架构的多模态 AI 智能体。

在技术架构上,采用 AI 原生设计理念,以 Serverless 为核心,通过函数计算、Serverless 应用引擎 SAE 和 GPU 资源池化技术,实现模型的弹性扩缩容与成本优化。平台集成开源 Dify 并深度优化,支持拖拽式编排与高可用部署,提升开发效率与系统稳定性。针对 AIGC 场景,利用 DeepGPU、Int4 量化等技术加速图像与视频生成,结合多级缓存实现模型秒级启动,满足智能创作业务的波峰波谷需求。平台还构建了 AI 网关、MCP 服务、全链路可观测体系(OpenTelemetry)和安全防护机制(如绿网过滤),保障高性能、高可用与合规性。典型应用覆盖智能找商找品、贸易趋势洞察、虚拟人播报、AI 玩具等多模态场景。

未来,小商品城将持续推进 Agent 全栈 Serverless 化,从 Dify 向函数计算 AI 演进,实现零代码构建与全场景覆盖,赋能商户与开发者,助力全球商贸智能化升级。

与光同尘

image

图为陈发灵,与光同尘 CEO,演讲《AI 赋能影视商业内容生产》

与光同尘在推动 AI 影视商业化过程中,深度依托阿里云函数计算 FC 构建面向 AIGC 的核心算力平台。作为Serverless 化 PaaS 产品,函数计算为其商业影像生成、短剧创作等业务提供了高可用、高弹性、低延迟的 GPU/CPU 算力集群,支持毫秒至秒级按需调度资源,灵活应对平峰与高峰的巨大流量差异。其按量付费模式显著降低资源闲置,兼顾性能与成本优化,保障稳定创作体验。

函数计算内置的安全隔离、自动容灾、监控告警、日志链路追踪和异步任务调度能力,帮助与光大幅减少运维负担,实现从 PoC 快速验证到规模化生产的高效演进,完成统一资源调度与全链路稳定性建设。同时,FunctionAI 的多模态创作能力 FunArt,能够一键部署 ComfyUI 等主流应用,并提供 Serverless 化 API,显著降低环境配置复杂度与部署成本。该实践充分展现了阿里云函数计算在 AI 内容生产场景中强大的弹性能力、工程化优势与商业落地价值,为 AI+ 影视行业提供了高效、可扩展的技术底座。

创蓝云智

image

图为张伟,上海创蓝云智信息科技股份有限公司研发总监,演讲《创蓝云通信系统 Serverless 改造实践》

创蓝云智作为领先的企业通信服务提供商,面对业务流量波峰波谷明显、手动扩缩容效率低、发布运维复杂等技术挑战,积极推进 Serverless 化改造。

通过采用阿里云 Serverless 应用引擎 SAE、云原生 API 网关和 MSE Nacos 注册配置中心,实现了架构升级,构建了高可用、弹性伸缩的云原生体系。落地 Serverless 后,发布效率提升 60%,故障恢复时间大幅下降 70%,整体成本降低 30%,系统 SLA 达到 99.99%。 在架构实践中,创蓝云智推行同城多活部署,结合 SLS、ClickHouse 进行日志分层存储,并通过低阈值弹性策略应对瞬时流量。未来,公司计划全面推进全应用 Serverless 化,覆盖短信、万数等核心业务,并探索 AI 原生架构,开展 Serverless GPU 在模型推理场景的测试,助力业务向智能化、高效化演进。

函数计算 FC X 安诺机器人打造“爆款”展区

image

image

阿里云函数计算 FC 携手安诺机器人在云栖大会计算馆展开为期三天展出,基于阿里云函数计算提供的 AI 图像生成能力与安诺机器人的物理执行能力进行融合。用户可通过云端 AI 生成专属个性化图像,再由作为具身智能终端的机器人复刻于咖啡之上,让看得见,摸得着的 AI 互动体验尽在一杯咖啡中呈现。

展出现场获得用户热烈好评,众多媒体、KOL 纷纷转发打卡,本次展出方案为线下零售提供了一套兼具技术前瞻性与商业可行性的互动体验升级方案。它不仅有效解决了当前行业面临的成本与体验问题,也为 AI 技术在实体经济中的应用提供了一个具体的、可规模化的范例。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/920951.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

删除 Ubuntu Nautilus 资源管理器侧栏的默认目录

Nautilus 是 Ubuntu 默认的文件管理器。默认情况下,系统会在侧边栏显示"图片"、"视频"、"文档"等用户目录文件夹,但这些可能并不是我们经常访问的位置。(默认情况下,红框处还存在音…

完整教程:整合与超越:论“开源AI智能名片链动2+1模式S2B2C商城小程序”对传统红人直播带货模式的升维

完整教程:整合与超越:论“开源AI智能名片链动2+1模式S2B2C商城小程序”对传统红人直播带货模式的升维pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: bl…

2025 最新隔音板厂家权威推荐排行榜:聚焦实力厂商,阻尼 / 聚酯纤维等全品类适配与标杆案例解析室外/KTV/隔音板安装/沈阳/ 厂房隔音板厂家推荐

随着居住与办公品质需求升级,噪声污染已成为影响生活工作的核心痛点,KTV、家庭影院、工厂车间等不同场景对隔音材料的性能、环保性与适配性提出差异化要求。然而当前市场中,隔音板产品质量参差不齐,部分厂商存在技…

在阿里云上建立网站的步骤天眼查询企业信息系统

From: http://www.cnblogs.com/lhb25/p/35-javascript-chart-and-graph-libraries.html 图表是数据图形化的表示,通过形象的图表来展示数据,比如条形图,折线图,饼图等等。可视化图表可以帮助开发者更容易理解复杂的数据&#xff…

2025 年医疗器械注册咨询公司最新权威推荐排行榜:TOP 级服务商全流程能力解析,助力企业高效合规拿证医疗器械注册咨询//二类医疗器械注册咨询/三类医疗器械注册咨询公司推荐

当前医疗器械行业监管持续收紧,注册流程涉及临床评价、体系辅导、生产许可等多环节,专业性极强,多数企业因缺乏专业经验面临材料准备不足、周期延长等问题,且市场上咨询服务商水平参差不齐,存在服务不规范、收费不…

庆网站制作公司wordpress在线文档

目录 一.什么是代码注释二.为什么写代码要注释三.代码注释的方式 1.单行注释,使用英文符号 #2.多行注释 方法一:英文状态下使用单引号 ”””方法二:英文状态下使用双引号 “” (和方法一有点类似)方法三:选中单行或者多行&#…

git合并最近的多个提交

1. 执行 rebase git rebase -i HEAD~3 这表示对 最近的 3 个提交 进行编辑。 2. 编辑提交列表 会弹出文本编辑器、看到类似:pick a1b2c3 提交1 pick d4e5f6 提交2 pick g7h8i9 提交3把后两个改成 s 或 squash:pick a…

珠海网站建设乐云seo在线制作网站建设费用预算表

前言 安装心得 经过多种方式操作,发现二进制方法安装太复杂,证书生成及其手工操作太多了,没有安装成功;helm方式的安装,v1.7.0的chart包执行安装会报错,手工修复了报错并修改了镜像地址,还是各…

Why Startups and Enterprises Are Betting Big on React for Frontend Development?

In today’s digital-first world, user experience is no longer a “nice to have”—it is the core product. Whether you’re building a SaaS platform, an e-commerce storefront, or a mobile-first consumer …

Redis HASH+RediSearch 设计自定义索引

目录一、核心设计:用 Hash 替代 Set 的结构定义1. 结构设计原则2. 为何此结构能替代 Set?二、关键操作实现:用 Hash 完成唯一性校验1. 依赖注入(基础配置)2. 业务层调用示例(以 Customer 表为例)三、集成 RediS…

数据结构:Map 和 Set(一) - 指南

数据结构:Map 和 Set(一) - 指南pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco…

《算法与数据结构》第七章[第1节]:图 - 指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

高校校园网网站内容如何建设做网站策划计划书

1.栈与队列 文章目录 1.栈与队列写在前面1.1栈与队列理论基础1.2用栈实现队列1.3用队列实现栈1.4有效的括号1.5删除字符串中的所有相邻重复项1.6逆波兰表达式求值1.7滑动窗口最大值1.8前K个高频元素 Reference 写在前面 本系列笔记主要作为笔者刷题的题解,所用的语…

Altium Designer 25.8.1 最新版安装指南

软件介绍 Altium Designer 25.8.1是一款功能强大的电子设计自动化(EDA)软件,广泛应用于消费电子、通信、汽车、航空航天等行业的电子设计开发。它集成了原理图设计、PCB布局、3D建模、仿真、文档生成等功能,无需切…

2025 年最新推荐地坪源头厂商权威排行榜:聚焦环氧 / 聚氨酯 / 固化剂等多类型地坪,精选 TOP5 优质企业水性聚氨酯/环氧/密封固化剂地坪施工厂商推荐

2025 年地坪行业虽在绿色环保与智能化趋势下持续发展,但市场乱象依旧突出。大量中小企业扎堆低端市场,同质化竞争激烈,价格战频发导致产品与服务质量参差不齐;高端功能性地坪材料仍存在部分依赖进口的情况,国产替…

杂题笔记

CF2133F Flint and Steel 首先把每个能爆炸的苦力怕爆炸极限跑出来,配合苦力怕位置(核心)组一个结构体 注意到爆炸序列是合法当且仅当不存在两个被引爆的苦力怕,他们的互相包含对方的核心 那么相邻两个苦力怕存在三…

HyperWorks许可证服务器配置

在复杂的工程设计和仿真环境中,高效、稳定的许可证服务器配置是确保团队顺畅协作、资源最大化利用的关键。HyperWorks作为业界领先的工程仿真软件,提供了灵活、可靠的许可证服务器配置方案,帮助用户轻松管理许可证资…

算法篇

算法 Algorithm 模拟 Simulation 模拟是基础,体现出你的代码能力,同时也考察你的阅读理解,以及情况是否考虑清楚 基本功:字符串输入[蓝桥杯 2022 国 AC] 内存空间 计算某年某月某日是星期几:如果纯模拟非常麻烦,…

企业网站设计模板免费下载夜间直播平台排行榜前十名

1、前言 本章将介绍yolov5的改进项目,为v5增加新的模块---注意力机制、SE模块 大部分更改的代码是重复的,只有少部分需要更改,下面会详细讲解 yolov5的yaml文件介绍:YOLOV5 模型:利用tensorboard查看网络结构和yaml文件介绍-CSDN博客 yolov5的模块更改,C3更改为C2f模块…