知识图谱(三)之知识查询语言

一:查询语言介绍

1.为什么不使用sql

关系型数据库查询语言——SQL

方式:数据以表的形式存在, 有比较强的schema定义, 表和表之间的数据关联以join的方式实现.

缺点:MySQL主要是存储和查询二维表数据,对三元组数据没有单独意义;

多跳关联查询需要多表连接,效率低

2.图数据查询语言的区别

二:命名实体识别(NER)

2.1基础知识

2.1.1什么是NER
  • 实体:文本之中承载信息的语义单元。

  • 常见的实体包括七种类别:人名、地名、机构名、时间、日期、货币、百分比。

  • 实体抽取:又称为命名实体识别,指的是从文本之中抽取出命名性实体,并把这些实体划分到指定的类别。

2.1.2识别后格式

原文本:

命名实体后的文本:

总体是字典格式,里面的命名实体是双层列表嵌套格式,下标是左闭右开.

补充:文本分类后的格式

2.2命名实体识别的方法

2.2.1基于规则的方法实现NER

使用自定义规则匹配NER:

eg:使用正则表达式匹配NER

优点:方便,快捷

缺点:泛用性差,后期格式越来越复杂,难以维护

2.2.2基于机器学习方法实现NER

机器学习把NER转换为序列标注任务

1.实现步骤:
  • 人工选择特征

  • 训练模型

  • 预测实体

2.模型选择

机器学习的方法是把实体抽取任务转换为序列任务,每个token做标注(理论上所有分类模型都可以作为标注模型,但是效果最好的是条件随机场(CRF)):

B:开头

E:结尾

3.缺点:

缺点:依赖特征的选择,特征选择的不好,很难有好的效果.

2.2.3基于深度学习的方法实现NER

深度学习也是把NER转换为序列标注任务

1.概念:

基于深度学习的方法主要使用神经网络模型,结合条件随机场模型。常用的神经网络模型包括卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)等,其中BiLSTM-CRF是目前最为常用的命名实体识别模型

2.原理:

3.优缺点

优点:特征靠模型自己提取

缺点:需要大量的标注文本

2.3NER评测标准

精确率:模型识别出来的实体中,被所有预测为正的样本中实际为正样本的概率

召回率:模型识别出来的实体中,实际为正的样本中被预测为正样本的概率

F1值: 准确率和召回率的调和平均值,可以对系统的性能进行综合性的评价

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1164471.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

救命!挖到零基础转网安捷径!超详细建议 + 分步骤教学,从入门到精通不踩坑!

运维工程师的日常工作 作为一名运维工程师,每天日常工作主要包括监控系统健康状况、处理紧急故障、进行系统优化、执行数据备份与恢复、以及参与IT项目和软硬件维护。监控系统健康状况是运维工程师的核心任务之一,涉及到使用各种监控工具来检测、记录系…

【毕业设计】基于Java的小区旧衣物回收与捐赠系统设计与实现基于SpringBoot的社区旧衣物回收与捐赠系统设计与实现(源码+文档+远程调试,全bao定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

学霸同款2026 10款一键生成论文工具测评:本科生毕业论文必备清单

学霸同款2026 10款一键生成论文工具测评:本科生毕业论文必备清单 2026年学术写作工具测评:为什么你需要这份榜单? 随着人工智能技术的不断进步,越来越多的本科生开始借助AI工具提升论文写作效率。然而,面对市场上五花八…

【课程设计/毕业设计】基于SpringBoot+Vue的西医药店药品管理系统的设计与实现基于SpringBoot的药店管理系统设计与实现【附源码、数据库、万字文档】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

恐怖!不懂黑客技术也能发起攻击?SQL 注入 / ARP 防护等关键防御必学!

作为涉网违法犯罪活动的典型代表之一,黑客类犯罪主要包括非法获取计算机信息系统数据、非法控制计算机信息系统、非法侵入计算机信息系统等。半月谈记者从北京市公安局网安总队了解到,去年以来,北京警方共计侦破黑客类案件113起,部…

无人机降噪技术及应用分析

无人机降噪主要通过“被动声学优化”、“主动控制系统”和“主动飞行管理”三种路径实现。下表汇总了主要技术路径及其核心原理:被动声学优化:从源头改变声音此路径通过优化无人机的物理结构和材料来直接减少噪音的产生和传播,是最基础的技术…

2026大模型完全指南:从入门到实战,程序员必备AI学习资源包

文章介绍了大模型的基本概念、学习价值及广泛应用场景,包括自然语言处理、内容推荐、教育、医疗等领域。分析了大模型时代的机遇,指出当前领域尚未形成系统性护城河,硬件提供商是主要受益者,并强调了小团队也能通过大模型技术创造…

收藏!AI小白程序员必看:构建可靠AI Agent系统全指南+大模型学习路线

本文专为AI入门小白与在岗程序员量身打造,系统梳理构建高可靠AI Agent系统的完整思路。核心拆解出“工具-推理-行动”三层核心架构,清晰界定各层级的核心职能、关键挑战,同时针对性给出风险规避要点。在此基础上,进一步深挖模块化…

全网最全9个AI论文软件,MBA高效写作必备!

全网最全9个AI论文软件,MBA高效写作必备! AI 工具助力论文写作,高效与精准并存 在当今快节奏的学术环境中,MBA 学生和科研工作者面临着日益繁重的论文写作任务。无论是开题报告、研究设计,还是数据分析与结论撰写&…

CTF Reverse模块系列分享(三):IDA实战通关!学会找主函数、定位加密逻辑

CTF Reverse模块系列分享(三):IDA实战通关!学会找主函数、定位加密逻辑 上期我们搞定了Reverse的核心前置知识——汇编基础和程序编译流程,今天咱们就如约进入Reverse工具实战的核心环节:IDA反编译与关键信…

收藏!从顺丰实践读懂大模型落地:AI智能体如何重构物流智能化升级【小白程序员必看】

在数字经济高速迭代的当下,物流行业正迈入“规模扩张”向“效率深耕”的关键转型期,高效协同与精准履约已然成为企业在激烈竞争中构筑核心壁垒的关键。传统物流管理模式过度依赖人工经验,在订单量爆发式增长、客户需求日趋个性化的当下&#…

大模型技术面试精华:从基础原理到实战项目,全面掌握大模型核心知识

本文汇总了大模型技术面试的两轮高频问题,涵盖LoRA微调原理、SFT训练技巧、Attention显存优化、分布式训练策略、LayerNorm选择依据、数据清洗方法、GRPO与PPO算法对比、奖励函数设计、RAG应用场景等核心知识点,以及代码实现题。内容全面覆盖大模型从理论…

深入浅出大模型训练原理:从小学到终身进修,程序员必学指南,建议收藏!

文章详细解析了大模型的训练过程,包括基础训练(学前准备、预训练、微调、对齐)和持续进修(学看学听、自我练习)。大模型通过用户反馈不断优化,从"能执行"向"能理解"、"能共情"演进。文章还提供了大模型使用技巧(设定角色、…

收藏!AI焦虑蔓延,程序员必看:掌握大模型,告别被替代风险

最近技术圈里的“AI焦虑”搞得人心惶惶,“大模型”、“替代程序员” 等词频频刷屏。 很多人疑问:浪潮之下,程序员到底要不要掌握AI大模型能力?不会饭碗还能保住吗? 其实大部分人还在死守老一套,而身边有的同…

不同类型的网站对于服务器配置的要求都有哪些

服务器是网站的“地基”,配置过高会造成资源浪费,配置不足则会导致网站卡顿、崩溃,直接影响用户体验与业务转化。但很多站长在选型时,常陷入“一刀切”误区——用同一套配置适配所有类型网站,最终要么成本超支&#xf…

学长亲荐2026自考AI论文平台TOP10:选对工具轻松过关

学长亲荐2026自考AI论文平台TOP10:选对工具轻松过关 2026年自考AI论文平台测评:选对工具事半功倍 随着人工智能技术的不断进步,越来越多的自考生开始借助AI写作工具提升论文撰写效率。然而,面对市场上琳琅满目的平台,如…

西门子S7-1200双轴焊接算法实战手记

西门子S7-1200 PLC双轴算法控制程序 西门子PLC做的电池焊接程序,电池包里面有n*m行列个电池,主要功能: 1.每个电池的焊点坐标能够独立调整 2.每个电池的焊接能量可独立选择 3.任意一个或者多个电池可以随机选择不焊接 4.可以选择某一边电…

微服务架构下的服务治理实战:从服务发现到熔断降级

前言 微服务架构把单体应用拆分成多个服务,带来了灵活性和可扩展性,但也带来了新的挑战:服务如何发现彼此?如何保证服务间的调用稳定?如何防止单个服务故障影响整个系统? 服务治理是微服务架构的核心&#…

昆仑通态通讯ABB ACS510变频器恒压供水:高效的一拖一到四解决方案

昆仑通态通讯ABB ACS510变频器恒压供水(一拖一到四 ABB变频器恒压供水触摸屏通讯程序 1.采用ABB变频器Acs510 自带恒压供水功能;2.用昆仑通态触摸屏直接通讯变频器; 3.变频器自身自带供水功能,省去plc,节约成本&…

PROLOG 7340-04 115908-004 伺服控制器卡

PROLOG 7340-04 115908-004 伺服控制器卡信息PROLOG 7340-04 115908-004 是一款伺服控制器卡,通常用于工业自动化系统中,负责控制伺服电机的运动。以下是关于该型号的一些关键信息:功能与特点用于控制伺服电机,提供精确的位置、速…