图谱实战 | 故障知识图谱技术落地探索:装备制造故障知识图谱构建及其应用案例剖析总结...

故障知识图谱是当前面向装备制造领域的落地重要探索领域,如何通过对设备的运行状态、运行日志进行信息抽取、关系建模,建成可供分析应用的知识库,并支撑故障诊断、维修辅助等应用场景,具有重要意义。

鉴于当前还未有系统性的开源相关项目整理出现,本文为了解决这一问题,从面向装备制造故障领域的知识图谱信息抽取、面向装备制造领域的移动端故障诊断分析平台以及代表性开源信息抽取组件三个方面进行介绍,从抽取评测(用于解决数据标注、定义和业务建模问题)、应用实例(用于解决如何用以及页面长啥样的问题)以及小白如何入门这几个层面进行揭示,供大家一起参考。

一、面向装备制造故障领域的知识图谱信息抽取

1、赛题背景

命名实体识别和关系抽取是知识图谱构建中两项重要的基础任务,自动构建高端装备制造业故障知识图谱对于实现高端装备制造的智能化检修和诊断具有重大意义。各种高端装备领域的故障案例文本是由业务专家或者专业维修人员撰写的描述相关设备异常、以及故障排查步骤的记录,该记录包括故障现象、故障原因、解决方法以及排故过程等,这些故障案例知识的利用受到数据结构化程度的影响,因而识别数据中的部件单元、性能表征、故障状态、故障检测工具等核心实体及其之间的组成关系至关重要。

地址:https://www.datafountain.cn/competitions/584

2、任务定义

本任务为信息抽取中的关系抽取任务,如图所示,带抽取的文本语料为工业制造领域的相关故障案例文本。

5b24e54fbf339fd6c713b6b95441f739.png

通过从大量故障案例文本抽取出部件单元、性能表征、故障状态、检测工具等实体及其关系,可以为后续高端装备制造业故障知识图谱构建和故障智能检修和实时诊断打下坚实基础。本任务需要从故障案例文本自动抽取4种类型的关系和4种类型的实体。关系类型为:部件单元的故障状态、性能表征的故障状态、部件单元和性能表征的检测工具、部件单元之间的组成关系。具体定义如下:

22e996bb64b6473bd3c31d9efd13736f.png

3、具体样例

{
"ID": "AT0003",
"text": "故障分析:1.经现场查看整车及动力电池故障灯报警;
2.用上位机查看故障码为总电压欠压二级,单体欠压二级,总压为133.6V,最高单体电压为3.373V,最低单体电压为3.121VSOC为17%初步判定SOC误差较大以及静态压差为265MV;
3.将该车充满电后总压为167.3V,最高单体4.189V,最低单体4.135V,故判断为单体压差过大;
4.当车辆总压为137.7V,SOC17%最高单体电压3.445V,最低单体电压为3.414V时,整车及动力电池故障灯报警,其故障为放电高温一级报警,此时动力电池最高温度为45℃(当天气温31℃,电充满温度为35℃途中路试未休息);
5.持续路试2次放电循环结果如下:①SOC10%总压为138V,最高单体电压3.454V,最低单体电压为3.428V,电池温度41℃、38℃(当天气温32℃路试中下雨,途中未休息)②SOC13%总压为139.5V,最高单体电压为3.493V,最低单体电压为3.459V,电池温度38℃、36℃(当天气温为30℃,分两次路试完成);
6.由于该车为OTS试制车根据以上所检测到的数据,SOC、温度、压差都不在正常范围内,依照现场条件,无法对上述异常情况现场进行排除。", "spo_list": [{"h": {"name": "SOC", "pos": [100, 103]}, "t": {"name": "误差较大", "pos": [103, 107]}, "relation": "部件故障"}, 
{"h": {"name": "总电压", "pos": [37, 40]}, "t": {"name": "欠压二级", "pos": [40, 44]}, "relation": "性能故障"}, 
{"h": {"name": "单体", "pos": [45, 47]}, "t": {"name": "压差过大", "pos": [167, 171]}, "relation": "部件故障"},
{"h": {"name": "车", "pos": [222, 223]}, "t": {"name": "报警", "pos": [231, 233]}, "relation": "部件故障"},
{"h": {"name": "车", "pos": [13, 14]}, "t": {"name": "报警", "pos": [22, 24]}, "relation": "部件故障"}, 
{"h": {"name": "动力电池故障灯", "pos": [224, 231]}, "t": {"name": "报警", "pos": [231, 233]}, "relation": "部件故障"},
{"h": {"name": "动力电池故障灯", "pos": [15, 22]}, "t": {"name": "报警", "pos": [22, 24]}, "relation": "部件故障"},
{"h": {"name": "单体", "pos": [45, 47]}, "t": {"name": "欠压二级", "pos": [47, 51]}, "relation": "部件故障"}]}

延伸项目地址: https://github.com/wgwang/CCL2022

二、面向装备制造领域的移动端在线设备故障诊断平台

1、赛题思路

随着工业生产自动化、数字化、智能化程度的日益加深,企业对设备的可靠性要求也越来越高。因而对设备故障的诊断和排除的研究具有重大的现实意义。互联网蕴含着大量有价值信息,是大数据的重要数据来源,也是经验交流留存的重要领地。通过对海量的分散的互联网数据进行采集,获取互联网上相关设备故障和维修解决方式,并形成知识库,可以提升故障判断的精准度和应用范围。

2、整体要求

当设备故障(某个或多个参数超出阈值)时,应用程序从网上抓取可能的故障原因和解决办法,并进行相关性排序总,形成匹配的故障诊断知识库;当出现类似故障时,应用程序先根据已有知识库诊断;若用户对诊断结果不认可,则通过网络抓取再次诊断,最终不断自我完善故障诊断知识库和精度。

数控机床故障诊断和维修是企业设备管理的难点和重点,设备在运行中会产生各种“疑难杂症”,不及时排出就会影响生产生活,甚至酿成事故。数控机床出了故障,一旦查清了故障点和故障原因,维修起来其实是一件比较容易的事。通过自适应设备故障诊断APP,根据故障信息,自动抓取互联网中适应的故障产生原因和优秀解决方法,形成知识库,将辅助设备维修人员快速诊断排出故障,保障生产。可以输入数控机床相关参数(品牌、型号、故障代码、某个或多个超出阈值参数、故障描述(文字或语音)等)或读取设备运行等相关数据,设置参数预警阈值;

3、项目概述

在这里我们介绍(https://github.com/wangrenyisme/Shukongdashi)这一项目,本项目是第八届中国软件杯大赛,基于移动端在线设备故障诊断平台的参赛作品。

该项目要求从网络上爬取相关设备故障和维修解决方式,并构建知识库,当设备出现故障时,用户通过输入数控机床相关参数(品牌、型号、故障代码、某个或多个超出阈值参数、故障描述(文字或语音)等),系统可以根据知识库来进行故障诊断和排除,如果没有满意的方案,系统会再次进行网络爬取,如果答案有效,则对知识库进行补充和优化。

我们设计系统时,主要的数据来源是《实用数控机床故障诊断及维修技术500例》这个PDF文档,我们尝试着对文档里的每一条故障描述进行拆解和分类(CNN),构建出了5中三元式推理规则,分别为:故障现象和故障现象之间存在并发症,故障前执行的操作间接导致的故障现象,某故障原因导致的故障现象,报警信息伴随的故障现象,故障部位常见的故障现象。使用Neo4j图数据库存储。

99d4d840e4f8b38e44631d4f55786472.png

当用户输入一条故障信息时,我们按照上面构建RDF的方法,对故障描述先按照标点符号分句,然后使用CNN分类,识别出此次故障中用户执行了哪些操作,出现了哪些故障现象,然后根据知识图谱进行对照,除了推理出故障原因以及解决办法之外,还会推理出与已经发现的故障相关的未发现的设备故障,通过用户进一步检查反馈,可以进一步提高诊断结果的可靠性。如果用户没有找到满意的解决方法,还可以通过在线爬取网上的解决办法来做参考,如果找到了满意的解决办法,系统会将此次维修记录补充到知识图谱中,实现知识库的自学习。

8519fa225a1c10cec64c2e175a164f2a.png

4、构建效果

来源数据:

52b2c5db6bb6f04d976ab049422e56df.png

建成图谱:59f512bdcae7ba166d8ec166004f7df8.png

实现效果:

a8bf796e06be65d503cfdba959edc08f.png

项目地址: https://github.com/wangrenyisme/Shukongdashi

二、知识图谱构建中的代表性信息抽取组件

最近找到一个质量较高的信息抽取相关组件,在本节中分享给大家:

1、NER实体识别组件

1)一种基于globalpointer的命名实体识别

地址:https://github.com/taishan1994/pytorch_GlobalPointer_Ner

2)一种基于TPLinker_plus的命名实体识别

地址:https://github.com/taishan1994/pytorch_TPLinker_Plus_Ner

3)一种one vs rest方法进行命名实体识别

地址:https://github.com/taishan1994/pytorch_OneVersusRest_Ner

4)一种级联Bert用于命名实体识别,解决标签过多问题

地址:https://github.com/taishan1994/pytorch_Cascade_Bert_Ner

5)一种多头选择Bert用于命名实体识别

地址:https://github.com/taishan1994/pytorch_Multi_Head_Selection_Ner

6)一种基于机器阅读理解的命名实体识别

地址:https://github.com/taishan1994/BERT_MRC_NER_chinese

2、三元组关系抽取

1)基于GlobalPointer的三元组抽取

地址:https://github.com/taishan1994/pytorch_GlobalPointer_triple_extraction

2)基于casrel的三元组抽取

地址:https://github.com/taishan1994/pytorch_casrel_triple_extraction

3)基于bert的关系抽取

地址:https://github.com/taishan1994/pytorch_bert_relation_extraction

4)基于LTP的三元组抽取

地址:https://github.com/taishan1994/ltp_triple_extraction

5)pytorch百度UIE关系抽取

地址:https://github.com/taishan1994/pytorch_uie_re

6)SpERT中文关系抽取

地址:https://github.com/taishan1994/SpERT_chinese

7)指针网络关系抽取

地址:https://github.com/taishan1994/PointerNet_Chinese_Information_Extraction

总结

本文主要从面向装备制造故障领域的知识图谱信息抽取、面向装备制造领域的移动端故障诊断分析平台以及代表性开源信息抽取组件三个方面进行介绍。

如文章中所介绍的,从抽取评测(用于解决数据标注、定义和业务建模问题)、应用实例(用于解决如何用以及页面长啥样的问题)以及小白如何入门这几个层面进行揭示,可以更好的加深对该技术的印象 。

对于评测和项目的细节,大家可以进一步查看,加深理解。

关于老刘

老刘,刘焕勇,NLP开源爱好者与践行者,主页:https://liuhuanyong.github.io。

就职于360人工智能研究院、曾就职于中国科学院软件研究所。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

9aa4fb7a4e6ffe83a032efe888745a1a.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477423.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

聊聊Spring Cloud版本的那些事儿

继续昨天说的计划,解惑一下收到比较多的问题。 有朋友问“为什么在很多文章中,大家引用的Spring版本名字都不一样呢?比如:Angel.SR6,Brixton.SR5等等,它们都有什么区别呢?”,今天我…

小样本学习只是一场学术界自嗨吗

文 | ALme知乎这两年看见很多人,包括我实习的mentor在内,都在批评few-shot learning,觉得是学术界在自high,思考良久,感觉有必要给这个领域正个名~(注意,此答案仅关注few-shot image classifica…

Spring Cloud构建微服务架构(六)高可用服务注册中心

近期因工作原因减缓了更新频率,同时为了把Spring Cloud中文社区搭建起来也费了不少时间,几乎每天都在挤牙膏般的凑时间出来做一些有意义的事。未能按原计划更新博文,在此对持续关注我博客的朋友们深表歉意。 之前在写Spring Cloud系列文章的…

技术动态 | 「可解释知识图谱推理」最新方法综述

转载公众号 | 专知近年来,以深度学习模型为基础的人工智能研究不断取得突破性进展,但其大多具有黑盒性,不 利于人类认知推理过程,导致高性能的复杂算法、模型及系统普遍缺乏决策的透明度和可解释性。在国 防、医疗、网络与信息安全…

ACL'22 | 陈丹琦提出CoFi模型剪枝,加速10倍,精度几乎无损

文 | jxyxiangyu我们都知道,为了让以深度神经网络为基础的模型更快地训练,人们提出了单机多卡、多机多卡等分布式训练的方式,那么,在模型预测推理阶段,有什么方法可以加速推理呢?遗憾的是,并行/…

LeetCode 第 19 场双周赛(231 / 1120,前20.6%)

文章目录1. 比赛结果2. 题目LeetCode 5311. 将数字变成 0 的操作次数 easyLeetCode 5312. 大小为 K 且平均值大于等于阈值的子数组数目 mediumLeetCode 5313. 时钟指针的夹角 mediumLeetCode 5314. 跳跃游戏 IV hard1. 比赛结果 做出来了1, 3, 4题,第2题结束后12分…

【Spring Cloud中文社区】正式启动

前段时间,开了个关于Spring Cloud的交流群,短短两周时间就聚集了一批爱好者与实践者,每天在交流群中大家都进行着各种不同深度的探讨,但是这些高质量的聊天记录无法被搜索引擎收纳,导致很多不错的研究内容无法分享给网…

图谱实战 | 无本体约束的开放知识图谱构建:以OpenIE为代表的开放信息抽取项目技术方案解读...

目前,本体一直是知识图谱落地过程中的容易受到抨击的点,很多非专业用户对图谱的需求,其实并不想花费大量的时间去做本体约束,而是想直接拿来就用,开箱即用,以达到搜索与分析等目的。对本体的强专业性门槛&a…

计算机视觉,凉了?

计算机视觉是人工智能的关键领域之一,是一门研究如何使机器“看”的科学。近年来,尽管计算机视觉技术在学术上取得了长足的进步,但由于缺少“现金牛”应用,经常在网络上出现“计算机视觉凉凉了”的言论。其实这种观点是非常片面的…

LeetCode 1346. 检查整数及其两倍数是否存在(哈希)

1. 题目 给你一个整数数组 arr&#xff0c;请你检查是否存在两个整数 N 和 M&#xff0c;满足 N 是 M 的两倍&#xff08;即&#xff0c;N 2 * M&#xff09;。 更正式地&#xff0c;检查是否存在两个下标 i 和 j 满足&#xff1a; i ! j0 < i, j < arr.lengtharr[i]…

微服务架构的基础框架选择:Spring Cloud还是Dubbo?

最近一段时间不论互联网还是传统行业&#xff0c;凡是涉及信息技术范畴的圈子几乎都在讨论微服务架构。近期也看到各大技术社区开始组织一些沙龙和论坛来分享Spring Cloud的相关实施经验&#xff0c;这对于最近正在整理Spring Cloud相关套件内容与实例应用的我而言&#xff0c;…

自监督学习效果差?Meta AI 提出 Q-score 快速过滤错误样本!

文 | jxyxiangyu自监督学习指的是不依靠人工标注数据&#xff0c;直接从数据中学习到有用的特征表示。自监督学习中所采用的监督信息可以是“是否属于同一实例样本”的二分类标签&#xff08;对比学习&#xff09;&#xff0c;也可以是一段连续的自然语言文本的下一个词&#x…

LeetCode 1347. 制造字母异位词的最小步骤数

1. 题目 给你两个长度相等的字符串 s 和 t。每一个步骤中&#xff0c;你可以选择将 t 中的 任一字符 替换为 另一个字符。 返回使 t 成为 s 的字母异位词的最小步骤数。 字母异位词 指字母相同&#xff0c;但排列不同的字符串。 示例 1&#xff1a; 输出&#xff1a;s &qu…

图谱实战 | 为什么我们需要医学知识图谱?

转载公众号 | OMAHA联盟 人工智能正在变得司空见惯。在医疗领域&#xff0c;医生也越来越重视人工智能所带来的疾病诊断效率和治疗价值的提升。要实现医疗人工智能&#xff0c;需要构建医学知识图谱以满足医疗领域对知识的应用需求。◆ ◆ ◆知识图谱是什么&#xff1f;知识图…

Spring Cloud构建微服务架构(三)断路器

在微服务架构中&#xff0c;我们将系统拆分成了一个个的服务单元&#xff0c;各单元间通过服务注册与订阅的方式互相依赖。由于每个单元都在不同的进程中运行&#xff0c;依赖通过远程调用的方式执行&#xff0c;这样就有可能因为网络原因或是依赖服务自身问题出现调用故障或延…

测试集涨点猛如虎,推上线无收益?算法新手翻车原因盘点!

文 | 杨旭东知乎在推荐算法领域&#xff0c;时常会出现模型离线评测效果好&#xff0c;比如AUC、准召等指标大涨&#xff0c;但上线后业务指标效果不佳&#xff0c;甚至下降的情况&#xff0c;比如线上CTR或CVR下跌。本文尝试列举一些常见的原因&#xff0c;为大家排查问题提供…

LeetCode 1348. 推文计数(哈希map+set)

1. 题目 请你实现一个能够支持以下两种方法的推文计数类 TweetCounts&#xff1a; recordTweet(string tweetName, int time) 记录推文发布情况&#xff1a;用户 tweetName 在 time&#xff08;以 秒 为单位&#xff09;时刻发布了一条推文。 getTweetCountsPerFrequency(s…

Spring Cloud构建微服务架构(二)服务消费者

在上一篇《Spring Cloud构建微服务架构&#xff08;一&#xff09;服务注册与发现》中&#xff0c;我们已经成功创建了“服务注册中心”&#xff0c;实现并注册了一个“服务提供者&#xff1a;COMPUTE-SERVICE”。那么我们要如何去消费服务提供者的接口内容呢&#xff1f; Rib…

2202年了,继续大比拼ViT、MLP、CNN结构有意义吗??

文 | 卖萌菌近日&#xff0c;MSRA发布了一篇题为《Transformer不比CNN强 Local Attention和动态Depth-wise卷积前世今生》的博文&#xff0c;再次谈论了这个老生常谈的话题。文中提到&#xff0c;Depth-wise CNN 和 attention 存在高度相似的结构&#xff0c;调参优化之后&…

Spring Cloud构建微服务架构(一)服务注册与发现

Spring Cloud简介 Spring Cloud是一个基于Spring Boot实现的云应用开发工具&#xff0c;它为基于JVM的云应用开发中的配置管理、服务发现、断路器、智能路由、微代理、控制总线、全局锁、决策竞选、分布式会话和集群状态管理等操作提供了一种简单的开发方式。 Spring Cloud包…