AI万亿美金机遇:构建下一代AI Agent与企业决策的上下文图谱平台

摘要

本文探讨了AI代理时代,企业软件系统的演变。传统系统如Salesforce和Workday是记录系统,而AI代理需要决策痕迹作为基础。本文提出“上下文图谱”概念:通过记录决策过程的例外、 precedent 和跨系统上下文,形成可查询的决策记录。这将成为下一个万亿美元平台,帮助企业实现自动化决策。针对初创企业,提供构建路径和投资信号,强调代理系统在执行路径中的优势。

全文

引言:AI代理时代的系统记录之辩

在企业软件的历史中,上一代系统通过掌控核心数据和流程,构建了一个万亿美元的生态系统。Salesforce管理客户数据,Workday处理员工事务,SAP主导运营流程。这些系统成为“记录系统”(systems of record),拥有规范数据、主导工作流,并实现用户锁定。

如今,随着AI代理的兴起,一个核心辩论浮出水面:这些传统系统能否在代理时代存活?Jamin Ball的近期文章《Long Live Systems of Record》引发了广泛讨论。他反驳了“代理杀死一切”的叙事,认为代理不会取代记录系统,而是提升了对优秀记录系统的标准。

我们赞同这一观点。AI代理是跨系统的、行动导向的。工作的用户体验(UX)正与底层数据平面分离。代理将成为界面,但底层仍需一个规范的系统作为支撑。

然而,我们的观点更进一步:Ball的框架假设代理所需的数据已存在于某处,代理只需更好的访问权限、治理机制、语义契约,以及明确规则来决定哪个定义适用于特定目的。这只是图景的一半。另一半是企业实际运行的缺失层:决策痕迹(decision traces)——包括例外、覆盖、先例和跨系统上下文,这些目前散布在Slack线程、交易桌对话、升级通话以及员工头脑中。

决策痕迹 vs. 规则:代理需要的不仅仅是规则

关键区别在于:规则告诉代理一般情况下该做什么(例如,“报告中使用官方ARR定义”),而决策痕迹捕捉特定案例中实际发生了什么(例如,“我们使用了X定义,在政策v3.2下,VP批准了例外,基于先例Z,并记录了变更”)。

代理不仅仅需要规则,还需要访问过去规则应用的决策痕迹:规则如何被应用、例外在哪里被授予、冲突如何解决、谁批准了什么、先例如何主导现实。这些痕迹构成了企业决策的“隐形知识”,目前未被系统化捕捉。

在这里,代理系统初创企业具有结构性优势。它们位于执行路径中。在决策时刻,它们看到完整上下文:从多个系统收集的输入、评估的政策、调用的例外路径、批准者和写入的状态。如果持久化这些痕迹,企业将获得目前大多不存在的东西:可查询的决策制作记录。

我们将这些痕迹积累形成的结构称为“上下文图谱”(context graph):不是模型的“思维链”(chain-of-thought),而是一个活的决策痕迹记录,跨实体和时间缝合,使先例变得可搜索。随着时间推移,这个上下文图谱将成为自治(autonomy)的真实真相来源——因为它解释了不仅仅是发生了什么,而是为什么被允许发生。

核心问题不再是现有记录系统是否存活,而是全新记录系统是否会涌现——针对决策而非仅对象的记录系统——以及这些是否将成为下一个万亿美元平台。

记录系统捕捉不到的内容:代理在真实工作流中的壁垒

AI代理正被部署到真实工作流中,如合同审查、报价到现金(quote-to-cash)、支持解决(support resolution)。团队们正撞上治理机制无法解决的墙。

这个墙不是数据缺失,而是决策痕迹缺失。代理遇到了人类每天用判断和组织记忆解决的歧义。但这些判断的输入从未作为持久化工件存储。具体来说:

  • 头脑中的例外逻辑:例如,“我们总是给医疗保健公司额外10%的折扣,因为他们的采购周期很残酷。”这不在CRM中,而是通过入职和闲聊传递的部落知识。

  • 过去决策的先例:例如,“上季度我们为公司X构建了类似交易——我们应该保持一致。”没有系统链接这两个交易或记录结构选择的理由。

  • 跨系统综合:支持负责人检查Salesforce中的客户ARR,看到Zendesk中的两个开放升级,阅读Slack线程标记的流失风险,然后决定升级。这种综合发生在头脑中。票据只说“升级到Tier 3”。

  • 系统外的批准链:VP在Zoom通话或Slack DM中批准折扣。机会记录显示最终价格,但不显示谁批准了偏差或为什么。

这就是“从未捕捉”的含义。不是数据脏乱或孤岛,而是连接数据到行动的推理从未被视为数据。

上下文图谱:持久化决策层

当初创企业通过代理编排层记录每个运行的决策痕迹时,它们获得了企业几乎从未拥有的东西:结构化、可重放的上下文转行动历史。

在实践中,这是什么样子?一个续订代理提议20%折扣。政策将续订上限设为10%,除非批准服务影响例外。代理从PagerDuty拉取三个SEV-1事件,从Zendesk拉取开放的“取消除非修复”升级,以及上季度VP批准类似例外的续订线程。它将例外路由到财务。财务批准。CRM最终只有一个事实:“20%折扣”。

一旦拥有决策记录,“为什么”成为一流数据。随着时间,这些记录自然形成上下文图谱:企业已关心的实体(账户、续订、票据、事件、政策、批准者、代理运行)通过决策事件(关键时刻)和“为什么”链接连接。公司现在可以审计和调试自治,将例外转为先例,而不是每季度在Slack中重新学习相同边缘案例。

反馈循环使这 compounding。捕捉的决策痕迹成为可搜索先例。每个自动化决策添加另一个痕迹到图谱。

这不需要从第一天实现完全自治。它从人机协作开始:代理提议、收集上下文、路由批准,并记录痕迹。随着类似案例重复,更多路径可以自动化,因为系统拥有结构化的先前决策和例外库。即使人类仍做决定,图谱也会增长,因为工作流层捕捉输入、批准和理由作为持久先例,而不是让它在Slack中消亡。

为什么现有巨头难以构建上下文图谱

Ball乐观地认为现有玩家会演变为这种架构。数据仓库成为“真相注册表”,CRM成为“带API的状态机”。他的叙事是演化而非取代。

这可能适用于使现有数据更易访问。但它不适用于捕捉决策痕迹。

运营巨头是孤岛化的,优先考虑当前状态。Salesforce推动Agentforce,ServiceNow有Now Assist,Workday为HR构建代理。他们的卖点是“我们有数据,现在添加智能”。

但这些代理继承了父系统的架构限制。Salesforce建立在当前状态存储上:它知道机会现在看起来如何,而不是决策时如何。当折扣被批准时,正当其的上下文未被保存。你无法重放决策时刻的世界状态,这意味着无法审计决策、从中学习或用作先例。

它们还继承了盲点。一个支持升级不只在Zendesk中。它取决于CRM的客户层级、计费的SLA条款、PagerDuty的近期中断,以及Slack标记流失风险的线程。没有巨头看到这些,因为没有巨头位于跨系统路径中。

数据仓库玩家有不同问题:它们在读路径中,而非写路径。

Ball将Snowflake和Databricks定位为“真相注册表”层。两者都在倾斜——Snowflake推动Cortex并收购Streamlit,Databricks收购Neon并推出Lakebase和AgentBricks。卖点:数据平台取代记录系统,成为AI代理的基础。

仓库确实有时间视图。你可以查询历史快照、跟踪指标变化,并在时期间比较状态。但仓库通过ETL在决策后接收数据。到数据落地Snowflake时,决策上下文已消失。

一个只看到事后读的系统,无法成为决策血统的记录系统。它能告诉你发生了什么,但无法告诉你为什么。

Databricks在拼凑这些部分上更先进。但接近代理构建处 ≠ 位于决策发生的执行路径中。

代理系统初创企业的结构性优势:它们在编排路径中。当代理分类升级、响应事件或决定折扣时,它从多个系统拉取上下文、评估规则、解决冲突并行动。编排层看到全貌:收集的输入、应用的规则、授予的例外和为什么。因为它执行工作流,它可以在决策时刻捕捉上下文——不是事后通过ETL,而是当下,作为一流记录。

这就是上下文图谱,它将成为AI时代公司最有价值的资产。

现有巨头会反击。他们会尝试收购来附加编排能力。他们会锁定API并采用出口费使数据提取昂贵—— hyperscalers使用的相同剧本。他们会构建自己的代理框架并推动“一切留在我们生态中”的叙事。

但捕捉决策痕迹需要位于提交时刻的执行路径中,而不是事后附加治理。巨头可以使提取更难,但无法插入它们从未参与的编排层。

初创企业的三条路径

代理系统初创企业将采取不同路径,每条都有权衡。

路径一:从第一天取代现有记录系统。一个围绕代理执行重建的CRM或ERP,带有事件源状态和原生政策捕捉的架构。这很艰难,因为巨头根深蒂固,但可在转型时刻 viable。

在众多瞄准AI SDR类别的初创中,Regie选择构建AI原生销售参与平台,取代像Outreach/Salesloft这样的遗留平台,这些是为人类在碎片化工具链中执行序列设计的。Regie设计用于混合团队,其中代理是第一类行动者:它可以 prospect、生成外展、运行跟进、处理路由,并升级到人类。

路径二:取代模块而非整个系统。这些初创针对例外和批准集中的特定子工作流,然后成为那些决策的记录系统,同时将最终状态同步回巨头。

Maximor在财务中这样做:自动化现金、关闭管理和核心会计工作流,而不撕掉总账。ERP仍是账本,但Maximor成为调和逻辑存在的真相来源。

路径三:创建全新记录系统。这些初创从编排层开始,但它们持久化企业从未系统存储的东西:决策痕迹。随着时间,这个可重放血统成为权威工件。代理层停止是“只是自动化”,成为业务去回答“为什么我们这么做?”的地方。

PlayerZero体现了这种模式。生产工程位于SRE、支持、QA和dev的交汇处:一个经典的“胶水函数”,其中人类携带软件未捕捉的上下文。PlayerZero从自动化L2/L3支持开始,但真正资产是它构建的上下文图谱:代码、配置、基础设施和客户行为在现实中如何交互的活模型。这个图谱成为“为什么这坏了?”和“这个变更会坏生产吗?”的真相来源:现有系统无法回答的问题。

随着初创追求这些路径,代理的可观察性将成为关键基础设施。随着决策痕迹积累和上下文图谱增长,企业将需要监控、调试和评估代理行为规模化。

Arize正在构建这个新栈的可观察性层——给团队可见性,看代理如何推理、哪里失败,以及决策随时间如何表现。正如Datadog成为监控应用的必需基础设施,Arize定位成为监控和改进代理决策质量的必需基础设施。

创始人关键信号

构建机会的信号重叠,但不相同。

适用于所有三条机会的两个信号:

  • 高头数。如果公司有50人手动做工作流(路由票据、分类请求或系统间调和数据),这是信号。劳动力存在因为决策逻辑太复杂,无法用传统工具自动化。

  • 例外密集决策。例行、确定性工作流不需要决策血统:代理只是执行。有趣表面是逻辑复杂、先例重要、“取决于”的诚实答案的地方。想想交易桌、承销、合规审查和升级管理用例。

一个指向全新记录系统机会的特定信号:

  • 位于系统交汇处的组织。

    RevOps存在因为有人必须调和销售、财务、营销和客户成功。DevOps存在因为有人必须桥接开发、IT和支持。Security Ops位于IT、工程和合规之间。

这些“胶水”函数是线索。它们涌现正是因为没有单一记录系统拥有跨功能工作流。组织图创建角色来携带软件未捕捉的上下文。

一个自动化该角色的代理不仅仅更快运行步骤。它可以持久化该角色创建的决策、例外和先例。那是通往新记录系统的路径:不是撕掉巨头,而是通过代理位于工作流中捕捉只在代理位于工作流时才可见的真相类别。

重新想象记录系统:下一个万亿美元平台的基石

问题不是记录系统是否存活——它们会。问题是下一个万亿美元平台是通过向现有数据添加AI,还是通过捕捉使数据可行动的决策痕迹构建。

我们认为后者。而且今天构建上下文图谱的初创正在奠定基础。

标签

#Context Graphs #AI Agents #上下文图谱 #AI代理系统 #决策记录 #企业自动化

原文链接

https://foundationcapital.com/context-graphs-ais-trillion-dollar-opportunity/

欢迎加入「知识图谱增强大模型产学研」zsxq,获取最新产学研相关"知识图谱+大模型"相关论文、政府企业落地案例、避坑指南、电子书、文章等,行业重点是医疗护理、医药大健康、工业能源制造领域,也会跟踪AI4S科学研究相关内容,以及Palantir、OpenAI、微软、Writer、Glean、OpenEvidence等相关公司进展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1155175.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

量化交易时代,普通散户的胜算还有多少?

在当今瞬息万变的资本市场中,您是否也曾感到困惑与无力?眼看着市场剧烈波动,却总是抓不住节奏,似乎总有一股强大的力量在主导一切。这股主导市场的力量并非无形,它有明确的名字:量化交易。这不仅是一种工具…

GLM-4.7底层技术拆解与落地避坑:开源大模型编码实战指南

在开源大模型编码能力日趋同质化的当下,智谱AI GLM-4.7凭借独特的推理架构设计与针对性优化,在SWE-bench Verified榜单中稳居开源第一梯队。不同于市面上侧重“功能罗列”的测评,本文从底层技术原理切入,拆解其思考机制的实现逻辑…

‌安全测试集成最佳实践

为什么安全测试必须“左移”并集成?‌在2026年的软件交付环境中,‌“安全是功能的一部分”‌ 已非口号,而是生存底线。根据Gartner 2025年报告,中国DevSecOps工具市场规模已达78亿元,年复合增长率42%,企业平…

‌2026年量子计算测试入门

一、为什么软件测试从业者必须关注量子计算?‌量子计算不再是实验室的专利。截至2026年初,全球已有超过‌47家云平台‌提供可编程量子计算服务(如IBM Quantum Network、Amazon Braket、阿里云量子实验室),‌NISQ&#…

GLM-4.7 实用化指南:提示词优化、本地化部署与跨场景适配秘籍

作为开源编码领域的标杆模型,GLM-4.7 不仅具备出色的代码生成能力,更凭借开源特性与灵活部署优势,成为开发者日常研发的高频工具。但多数使用者仅停留在“基础调用”层面,未能充分发挥其性能潜力。本文跳出传统测评框架&#xff0…

区块链应用测试全指南

迎接分布式信任的测试挑战区块链技术以其去中心化、不可篡改、透明可追溯等特性,正深刻重塑金融、供应链、物联网、身份认证等众多领域。作为软件测试从业者,我们面临着前所未有的机遇与挑战:如何确保构建在区块链这一独特架构之上的应用&…

matlab实现GMSK信号调制和解调

GMSK(Gaussian Minimum Shift Keying)是一种基于高斯滤波的调制技术,它结合了MSK(Minimum Shift Keying)和Gaussian滤波的特性,以减少频谱扩展和提高频带利用率。在MATLAB中实现GMSK信号的调制和解调可以分…

亚马逊跨境电商2026 开年这波“变量”到底怎么应对?

这两周我在卖家群里看到的关键词很统一:“成本又变了、直邮更不稳了、欧盟合规更麻烦了、流量入口开始被 AI 抢走了。” 如果把 2026 开年当成一个分水岭,我更愿意把它叫做——跨境从“会运营”进入“会经营”的阶段。 下面我按“你马上会踩到的坑”来拆…

深入浅出 Istio VirtualService:从基础路由到高级流量治理的实战指南

文章目录一、 核心逻辑:VirtualService 的“三位一体”模型二、 深度场景实战场景 1:南北流量入口——服务的“门面”担当场景 2:东西流量治理——平滑的金丝雀发布场景 3:A/B 测试——基于用户特征的精准画像路由场景 4&#xff…

【IEEE出版、连续4届稳定EI检索】第五届电气、控制与信息技术国际学术会议(ECITech 2026)

继往届ECITech年度系列会议的成功举办,第五届电气、控制与信息技术国际学术会议(ECITech 2026)由南京工业大学和安徽大学联合主办,会议将于2026年3月13日-15日在中国南京线下举办。 会议将继续围绕电气、控制与信息技术等研究领域…

深度解析 Istio 流量五虎将:Ingress、Egress、Gateway、ServiceEntry 与 VirtualService

文章目录一、 角色定位:谁是实体?谁是配置?二、 核心关联:流量是如何流动的?场景 1:南北流量——外部用户访问内部服务(Ingress)场景 2:东西/南北流量——内部服务访问外…

得物App智能巡检技术的探索与实践

一、背景 随着得物App各业务功能的丰富和升级,得物App内可供用户体验的内容和活动逐步增多,在用户App内体验时长不断增长的大背景下,App使用过程中的体验问题变得愈发重要。同时,在整个功能研发流程中,App端的测试时间…

英超阿森纳这个球队怎么样?

作为英超最长情的观察者(自1886年建队以来从未降级),阿森纳总能用它的独特魅力吸引你。它既是一部厚重的足球历史书,又是当下欧洲足坛最锋利、最沉稳的力量之一。下面让我为你展开这幅“兵工厂”的画卷。 一、 球队名片 昵称&…

收藏级干货!2025年AI工程化范式转移:从Chatbot到Agent的系统架构演进全解析

本文深入分析了2023-2025年AI工程生态的范式转移,从Chatbot到Agent与系统工程的演进。详细介绍了现代LLM应用的四层架构(智能层、能力层、连接层、编排层),探讨了智能体的定义、认知架构及多智能体系统,对比了Tools与S…

MCU的最小系统都需要哪些?

MCU(Microcontroller Unit,微控制器)最小系统,是指让一片 MCU 芯片独立完成上电启动、执行基础程序所必需的最精简电路集合。它如同电子设备的 “裸机核心”,仅保留 MCU 运行的绝对必要条件,不包含任何用于…

【珍藏】一文掌握Bridgic动态拓扑:三种编排模式的代码实现与原理解析

文章介绍了Bridgic框架中的三种编排模式:静态编排、动态编排和自主编排,通过代码展示了它们如何实现。核心是动态有向图(DDG)架构,支持运行时动态修改拓扑结构,满足AI Agent系统的高度动态性需求。框架提供了add_worker、ferry_to…

‌测试技术债务管理

一、测试技术债务的本质与分类‌ 测试技术债务(Testing Technical Debt)是软件测试领域中因短期妥协而累积的长期维护成本,其本质是‌测试资产质量的系统性退化‌。与开发技术债务不同,测试债务不直接体现在业务功能缺陷上&#…

深度解析:智能体反思模式:解决AI输出质量问题的终极方案,开发必藏!

本文详细介绍了智能体设计中的反思模式,这是一种让智能体对自身输出进行评估并自我优化的机制。通过"执行-评估-优化"的闭环迭代,智能体能主动发现问题、修正错误,大幅提升输出质量。文章阐述了反思模式的概念特征、价值意义、典型…

汽车制造业如何借助工业解决方案实现数字化转型?

在汽车制造加速智能化转型的今天,“工业解决方案”这个词,正悄悄褪去它以往那种设备堆砌的冰冷印象,变得更像一场系统性的生命重构——数据是血脉,AI是大脑,真实的生产场景成了它鲜活的肌体。我们说,这场变…

‌如何做探索性测试

探索性测试的定义与重要性‌ 探索性测试(Exploratory Testing, ET)是一种非脚本化的软件测试方法,由测试人员实时设计、执行和优化测试用例,依赖个人技能、经验和直觉来发现潜在缺陷。与脚本化测试不同,ET强调在测试过…