从制度治理到生成式治理的根本转变
1
数据治理是上一代信息化的体系性问题
过去十多年,企业在数据治理上的投入并不算少。沿着数据治理方法论,我们有主数据、元数据、数据标准、数据质量、数据资产目录、数据开发与分析、安全分级分类……几乎每一个治理要素,都有成熟的治理体系和产品形态。然而,在大量企业的真实的实践中,数据治理始终呈现出一种制度优先、事后介入的状态:标准需要被记住规范需要被遵守治理依赖人工评审和协调系统只能记录结果,而无法影响过程等等的诸多问题,核心问题是:过去的数据治理是一种制度优先的离散工作,成为一个多部门,多链条,长周期的复杂工程,在熵增理论的本质之下,数据组织和系统必然有着天然的走向无序的惰性。过去我们的企业以严格管理之精神,对抗着我们自身在数据与流程中有意和无意的造成的数据腐化。最终,数据治理演变为“治人”,而不是“治数据”。这,正是上一代数据治理方法与系统的根本局限,虽然我们都知道其本质,但是在上一代的企业架构之下,并没有什么好的解决办法。
2
生成时代的信息架构革命
这一轮技术变革中,真正改变企业 IT 架构形态的,并不是某一个 AI 工具,而是系统的生成方式发生了改变。以 vibe coding 为代表的新范式,正在将系统构建从人工逐行实现模式,提升到意图设计驱动与自动生成,正在重塑软件系统的构建逻辑。这种变化的本质,是将大量原本依赖个人经验与即时判断的决策,转移给可推理、可复用的智能系统。这直接影响了长期困扰 IT 系统及其数据质量的熵增问题。首先被优化的,是对人工规范执行的高度依赖。在传统模式下,数据标准与规范和治理规则必须通过文档宣贯、人工培训和评审流程才能被落实,其执行效果高度依赖个体经验、自觉性和时间成本。而在以代码生成机制为基础的体系中,规范不再依赖人工记忆,而是直接嵌入生成逻辑之中,成为系统在建模和开发瞬间必须遵循的前置条件。其次被缓解的,是数据与开发之间的时间错位问题。传统数据治理大多发生在设计完成、系统上线,甚至运行之后,以评审、盘点和整改的方式介入。这种事后治理天然滞后,往往在问题已经形成之后,才付出更高成本进行修复。数据智能体的引入,使治理前移到数据结构生成的实时过程中,将原本需要事后纠偏的问题,转化为事前约束和即时校验。第三个被根本性改善的,是知识不可复制带来的问题。过去,数据的一致性、指标口径的稳定性,往往依赖少数资深人员的经验判断。一旦人员变动,系统理解能力随之流失,数据体系迅速走向分化和漂移。智能体将这些隐性经验转化为可推理、可复用的规则与上下文,使数据治理能力第一次摆脱对个人的依赖,成为组织层面的持续能力。同时被削弱的,还有系统割裂带来的治理盲区。在传统架构中,各个系统平台彼此分离,治理信息难以贯通,导致资产孤岛和口径不可追溯。基于智能体的体系通过对多类数据系统的统一理解与连接,使数据结果处于同一认知框架之下,治理不再依赖跨系统对账,而是由统一的语义和推理能力自然支撑。
3
数据智能综合体
在业界对数据智能体的诸多探索中,我们(Datablau)推出了新一代的数据建模智能体,之所以选择以数据智能体作为整体能力的切入点,并非偶然,而是源于对 AI 时代数据问题本质变化的判断。相比从分析、问答或治理功能入手,这一路径在语义一致性、系统设计以及跨域连接能力上,具备天然且难以替代的优势。首先,在AI 时代,数据治理的重心正在转向“知识与语义治理”,而数据模型是语义治理最关键、也是最佳可落地的核心输出物。诸如指标口径、业务术语、实体关系、事实与维度的划分,本质上都是语义问题,而这些语义最终通过数据模型这种结构化形式被固定下来。脱离数据建模的语义治理,只能停留在概念层面;而以数据建模智能体为核心,则可以将业务语义、指标定义和治理规则直接沉淀为可执行、可推理的数据结构。今天本体建模也受到了广泛关注,我们必须认识到,本体建模与数据建模在业务语义和规则的继承性,我会另写文章来说明。其次,AI 时代的开发工程正在重新分工,设计的重要性显著上升,而具体 Coding 本身正在被大模型高度商品化。今天的代码自动生成工具,已经证明大模型在实现层面具备极强能力。真正稀缺的,不再是怎么写代码,而是应该如何需求分析和设计。数据模型正是这一设计层的集中体现,它承载的是业务抽象、分析视角和长期演进逻辑。以数据智能体切入,意味着把智能用在最具长期价值、最难被简单替代的设计层,而不是在实现层反复叠加自动化能力。第三,数据模型天然处于需求分析,应用开发、数据分析等工作的交汇点,是整个数据体系的核心中枢。向上,它连接业务需求和分析目标,决定指标口径和分析视角;向下,它约束数据仓库结构、数据服务接口以及应用系统的数据使用方式;横向,它关联数据资产、血缘关系和治理规则。这种中枢位置,使数据建模智能体能够在不同场景中切换角色,而不丢失上下文。相比从单一使用场景切入的智能体方案,这种能力具有天然的扩展性和不可替代性。基于上述判断,我们构建了一个类似Cursor 形态的数据建模智能体。它可以接入大模型能力,同时融合基础数据模型、指标体系、业务术语知识库和企业级数据规范,在统一语义上下文中扮演数据建模、数据分析、数据资产盘点等多重智能角色。由此,数据治理不再依赖外部制度和事后检查,而是在数据结构生成的过程中自然发生。 当然,在这一体系下,原有的数据治理系统并未消失,而是回归为治理过程与结果的记录系统;真正决定数据质量、一致性与可演进性的核心能力,已经前移到以数据智能体为中心的设计与生成阶段。这也正是我们认为,数据智能综合体,将是AI 时代数据治理的正确打开方式。
体验Datablau DDM Dora智能体,请联系小助理:datablauxzs