在构建企业级知识图谱的过程中,图谱模型永远是第一步,也是最关键的一步。
很多用户在使用知识图谱产品时,习惯先上传文档、直接开始抽取,结果往往会遇到这样的问题:
抽取结果杂乱、关系混乱、后续难以用于问答和分析。
在 qKnow 知识平台中,我们始终坚持一个原则:
没有模型的知识,就像没有骨架的身体——信息再多,也无法形成真正可用的“智能”。
本期内容,我们将以实际操作为线索,带你系统了解:
在 qKnow 中,如何从业务目标出发,构建一个高质量、可持续演进的图谱模型,为后续的结构化抽取、智能问答与推理分析打下坚实基础。
一、什么是图谱模型?
图谱模型,可以理解为企业知识世界的“元结构”。
它并不直接存储具体知识内容,而是用来回答三个最根本的问题:
- 业务中有哪些核心对象?
- 每一类对象有哪些关键属性?
- 不同对象之间是如何相互关联的?
在 qKnow 知识平台中,这三个问题分别对应了三类核心配置能力:
- 概念配置:定义“有什么”
- 属性配置:定义“长什么样”
- 关系配置:定义“彼此如何连接”
只有先把这套“骨架”设计清楚,后续的知识抽取、存储和应用,才能有序展开。
二、构建图谱模型:从目标开始
图谱模型不是凭空设计的,而是从明确的业务目标反推而来。
在开始配置模型之前,第一件事不是点按钮,而是回答一个问题:
我希望从这些文档中,最终得到什么样的知识?
示例:疾病领域知识图谱
以疾病领域为例,假设你的知识中心中已经上传了一批与疾病相关的文档,你希望从中抽取如下信息:
- “高血压”表现出“头疼”
- “高血压”原因是“过量饮酒”
- “高血压”需要“静脉给药”
那么,这些需求本质上已经隐含了图谱的核心结构,可以抽象为以下三类关系:
- 疾病 — 表现出 — 症状
- 疾病 — 原因是 — 病因
- 疾病 — 需要 — 治疗方法
这一步,其实就是从自然语言描述,提炼结构化三元组的过程。
三、新增图谱模型
在明确构建目标后,即可在 qKnow 中新增图谱模型。
操作流程如下:
- 点击图谱模型管理页面的「新增」按钮
- 输入模型名称、标签等基础信息
- 点击「确认」,完成图谱模型创建
模型创建完成后,点击「详情」按钮,即可进入该模型的专属配置页面。
该页面主要包含以下子模块:
- 概念配置
- 关系配置
- 抽取任务回显
- 智能抽取记录
四、构建概念:定义知识世界的“对象”
在图谱模型中,概念是最基础、也是最重要的元素。
继续以上疾病领域的示例,我们需要依次新增以下关键概念:
- 疾病
- 症状
- 病因
- 治疗方法
这些概念并不是一次性设计完成的,而是可以随着业务演进逐步补充和扩展。但在初期,一定要围绕当前抽取目标,优先定义“最核心、最常用”的概念。
完成这些概念的创建,相当于为整个知识图谱打下了第一层结构基础。
五、构建属性:让概念“可被精细化描述”
仅有概念还不够,很多场景下,我们还需要从文档或数据表中抽取结构化字段信息。
这正是属性配置的价值所在。
例如,在疾病相关的数据表中,可能存在如下字段:
- 疾病名称
- 疾病描述
- 发病概率
- 风险等级
这些字段,都可以作为“疾病”概念的属性进行配置,并根据字段特点设置属性类型,如:
- 文本
- 数值
- 字典
操作方式
- 在对应概念的操作栏中点击「属性」
- 进入该概念的属性配置页面
- 点击「新增」,完成属性定义
合理的属性设计,将直接影响后续结构化抽取的质量与稳定性。
六、构建关系:让知识“连起来”
当概念和属性都准备就绪后,下一步就是关系配置。
关系,决定了知识图谱是否真正“成网”。
以“疾病 — 表现出 — 症状”为例:
- 起点概念:疾病
- 关系名称:表现出
- 终点概念:症状
完成上述配置后,即可新增一组有效关系。
AI 辅助抽取能力
如果你对文档内容不够熟悉,qKnow 也支持通过AI 智能抽取的方式,辅助生成概念与关系建议。
需要注意的是:
AI 抽取是“辅助”,不是“替代”。
AI 抽取完成后,仍需要人工进行筛选与确认。
最终确认的三元组结果,可以在AI 抽取记录中查看,并看到对应的准确率评估。
概念与关系的设计,直接决定了图谱整体结构的上限,值得投入足够的时间认真打磨。
七、其他子模块与结果回显
在图谱模型详情页面中,qKnow 还会同步展示:
- 结构化抽取任务列表
- 非结构化抽取任务列表
- 各任务的抽取结果回显
当概念、属性和关系配置完成后,还可以在图谱模型管理列表页,直观查看当前模型下的概念关系结构。
总结:图谱模型,是一切能力的起点
图谱模型并不是一个“配置步骤”,而是知识工程的起点。
只有先把这张“骨架”搭建好:
- 结构化抽取才能更精准
- 非结构化抽取才能更稳定
- 智能问答和推理分析才能真正可用
在 qKnow 中,图谱模型不仅是一种配置能力,更是一种帮助企业把知识“想清楚、搭清楚、用起来”的方法论。
下期预告
《如何从非结构化数据中抽取数据形成图谱》
我们将进一步拆解:
文档、文本是如何在模型约束下,被一步步转化为可计算、可推理的知识网络。