知识图谱入门视频(三)

学习内容

小象学院 b站 第三章
【其实后面的方法学习只是一个框架式的学习,并不明白具体的操作】
链接

问题:

  1. 知识图谱究竟是什么?
    可以看看开放知识图谱
    其实就是将我们的语言拆分转换为符号表达,之后经过机器学习来将离散式的数据转化为可分布式的表达。
    而知识图谱的构建,是可以不同的,根据需要来定!比如只是关于人际关系的,再比如关于某个人的所有的新闻,再比如全部是关于政府部门的或者是事故的,所以也就有了知识的融合
  2. 企业构建知识图谱需要根据需求来的
  3. 自然语言转化为sql(知识图谱),后面会讲
  4. 开放数据是不能直接用的
  5. schema和本体关系 :schema是轻量级本体;
  6. 图数据库是用来存储知识图谱;
    多库存储的难点:是在于存储的问题还有查询问题,本体需要不需要切分,消除歧义等;
  7. 知识库和知识图谱有什么区别?
    知识图谱是一个大的系统; 知识图谱里面关于知识构建、知识融合之后就产生了知识库,而知识库我们就需要对它进行存储,就会产生图数据库。
  8. 怎么确保数据的准确性
    对于开放数据库等进行领域建模、领域知识进行筛选

第三部分: 知识图谱技术概览

1. 简介

由于数据源的不同,比如众包、传感器、多媒体等流,我们又可以分别使用不同的方法来得到更加规范的数据表示、更强的数据关联,并存储到Hbase等数据库中,之后根据具体的需要再利用这些知识进行知识表示、知识抽取、知识问答等应用。
而知识表示是根本

2. 知识表示

知识表示研究怎样用计算机符号来表示人脑中的知识,以及怎样通过符号之间的运算来模拟人脑的推理过程。
现在一般基于数理逻辑的知识表示–》基于向量空间学习的分布式知识表示。
语义网知识表示框架
在这里插入图片描述
w3C可以看到最新的语义网知识表示框架。

2.1 知识表示的离散分布

2.1.1 RDF:Triplet-based Assertion model (基于三元组的断言模型)

链接
RDF: (资源描述框架,Resource Description Framework)是描述网络资源的 W3C 标准, ,比如网页的标题、作者、修改日期、内容以及版权信息等。
RDF的含义就是描述资源的框架(Framework for Describing Resources),下面我们逐个来看这三个词的意思。
资源(Resource):所有在Web上被命名、具有URI(Unified Resource Identifier 统一资源描述符)的东西。如网页、XML文档中的元素等;
描述(Decription):对资源属性(Property)的一个陈述(Statement),以表明资源的特性或者资源之间的联系;
框架(Frameword):与被描述资源无关的通用模型,以包容和管理资源的多样性、不一致性和重复性。
综合起来,RDF就是定义了一种通用的框架,即资源-属性-值的三元组,一不变应万变,来描述Web上的各种资源。
下面我们来看一个简单的RDF的例子:
(指明被描述资源的URI)
Tim Bray (被描述资源有一个叫Author即作者的属性,其值是Tim Bray)
(被描述资源有一叫Home-Page即主页的属性,其值指向另一资源)
(结束标志)

RDF Graph: Directed Labeled Graph(有向标记图)

2.1.2 RDFS:Simple Vocabulary and Schema(简单的词汇和模式)

RDF的序列化格式
schema: 和数据库中表的设计类似!
常用的格式: RDF/XML、RDFa
具体实现

下面是RDF语法的一个实例,用序列语法表示如下:
就只是包含了title、creator、data三个属性

<?xml version=“1.0”?><RDF xmlns=http://www.w3.org/1999/02/22-rdf-syntax-ns#xmlna:DC=http://purl.org/metadata/dublin-core#><Description about=http://www.dlib.org/dlib/may98/miller><DC:title>An introduction to the Resource Description Framework</DC:title><DC:creator>Eric Miller</DC:creator><DC:date>1998-0501</DC:date></Description></RDF>

这个例子如果以RDF简略语法来表示则为:

<?xml version=“1.0”?><RDF xmlns=http://www.w3.org/1999/02/22-rdf-syntax-ns#xmlna:DC=http://purl.org/metadata/dublin-core#><Description about=http://www.dlib.org/dlib/may98/miller>DC:title = “An introduction to the Resource Description Framework"DC:creator = "Eric Miller"DC:date = "1998-0501"</Description></RDF>

2.1.3 OWL:Web Ontology Language

本体 == 哲学的概念
但是不能直接用。是描述语言。 多人进行描述
OWL extends RDF schema
在这里插入图片描述
OWL:OWL Web本体语言,W3C推荐标准
这种本体描述语言,可以用来描述Web文档和应用中内在的类和关系。
为什么使用OWL语言?

  • 通过定义类以及类的属性来形式化某个领域;
  • 定义个体并说明它们之间的属性;
  • 在OWL语言的形式化语义允许的层次上,对类和个体进行推理。
    推理规则: 比如属性链,姚明的父亲的父亲。

SPARQL简介
上面做了知识库,那么就会有知识库的查询;
SPARQL(SPARQL Protocol and RDF Query Language),是为RDF开发的一种查询语言和数据获取协议,它是为W3C所开发的RDF数据模型所定义,但是可以用于任何可以用RDF来表示的信息资源。
在这里插入图片描述
怎么去查询和存储在后面去讲解。
在这里插入图片描述
这里的 ?其实是可以被替代的,需要我们去填充它; 所以知识图谱上的查询更多的是主图匹配,怎么快速的去完成主图匹配,在图中有同构的判断其实是一个np hard问题。所以我们在nlp中要学会怎么去转化为spaRQL问题
这里的spaRQL也可以写成图的形
JSON-LD:数据交换格式
在这里插入图片描述
6. RDFa、HTML5 MicroData:在网页中嵌入语义数据
在这里插入图片描述
上面的一句话是对一个电影的描述, 我们可以将每句话的每个词进行分类。
做结构化信息,放到一些排序的函数当中,通过知识众包去验证这是一个高质量的知识之后,搜索引擎会帮你免费的优化,使得你可以根据关键词进行排序搜索。

2.2. 知识图谱的分布式表示KG Embedding

前面的都是分布式的表示,下面的是知识图谱的分布式表示-KG Embedding
在这里插入图片描述
在保留语义的同时,将知识图谱中的实体和关系映射到连续的稠密的低维向量空间。 在这个过程中我们使用三种方法:张量分解、神经网络、距离模型。

在这里插入图片描述
张量分解: 多维的矩阵我们称为张量,它不是一个二维的,因为二维指针是二维的;所以是用来刻画我本身的entity和relation之间的关联,并且选出它们之间低维的标注,这里的A其实就是entity,R则是relation,每个relation和各个entity之间的交互
神经网络:基于neural Tensor Layer的知识图谱。使得一些正确的三元组势能更高,错误的三元组势能更低;
距离模型: 是经常用到的方法,用在在低维的向量和原本的低维向量语义的距离; 是在翻译中决定的。

3. 知识抽取: NLP + KR

在这里插入图片描述
从下往上看;

3.1 主要方法

模板的选取必须是准确的,有选择的;
在这里插入图片描述
在这里插入图片描述

4. 知识存储

在这里插入图片描述

5. 知识融合

6. 知识问答

在这里插入图片描述

6.1 KBQA例子:

姚明的身高;
谁是第三十五届美国总统;

6.2 KBQA基本实现流程:

7. 知识推理

简单而言,推理是指基于已知事实推出未知的事实的计算过程;
大部分搜索引擎目前都已经支持了一定的推理能力;
百度输入:姚明的女儿的妈妈的老公
这就是属性链,前面的本体的属性
在这里插入图片描述

7.1 基于描述逻辑的推理:本体推理

7.2 基于规则挖掘的推理

比如小明和小红是小王和小李的孩子,那也可以说小王和小李是小明和小红的父亲;

7.3 基于表示学习的推理

8. 语义搜索

9. 知识融合

Data Linking、Knowledge Fusion、Record Linkage、Entity Alignment。。。
主要目的是不同数据源中的实体信息进行整合,形成更加全面的实体信息。
比如一个人改变了发型或者是戴上墨镜等都是他本人。
比如维基百科、百度百科、互动百科都有类似的表达,或者其它没有的内容。

9.1 知识融合:典型工具-Dedupe

主要处理流程是对所有records进行clustering,然后在组内部通过计算相似度特征和机器学习分类模型对任意一对records进行预测是否为同一实体。
要求两个数据集有相似的结构

9.2 知识融合:典型工具-LIMES

不要求两个数据集的实体具有相似的结构,
可灵活配置匹配规则,自定义距离计算模型。

10.知识众包:Wikibase、Schema.ORG

结构化数据协同编辑叫wikibase;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/476319.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

博客新皮肤上市

原创&#xff1a;冰极峰 有朋友说原来的博客不好看&#xff0c;趁着五一节放假&#xff0c;花了点时间重新制作了一套样式&#xff0c;图片借用一个外国博客的图片。 样式全部基于自定义皮肤样式改写的。 说实话&#xff0c;改写博客园样式是一件比较痛苦的事情&#xff0c;你不…

python调用接口测试_Python接口测试实战2 - 使用Python发送请求

本节内容requests安装requests使用JSON类型解析requests库详解带安全认证的请求序言上节课我们学习了接口测试的理论&#xff0c;抓包工具及使用Postman手工测试各种接口&#xff0c;这节课我们主要讲解使用Python语言来发送接口请求&#xff0c;实现接口测试自动化。发送请求,…

LeetCode 551. 学生出勤记录 I

1. 题目 给定一个字符串来代表一个学生的出勤记录&#xff0c;这个记录仅包含以下三个字符&#xff1a; A : Absent&#xff0c;缺勤 L : Late&#xff0c;迟到 P : Present&#xff0c;到场如果一个学生的出勤记录中 不超过一个’A’(缺勤) 并且 不超过两个连续的’L’(迟到…

论文阅读笔记(一)【Journal of Machine Learning Research】Natural Language Processing (Almost) from Scratch(未完)

学习内容 题目&#xff1a; 自然语言从零开始 Natural Language Processing (Almost) from Scratch 2021年7月28日 1-5页 这将是一个长期的过程&#xff0c;因为本文长45页&#xff1b; 每天给自己定为5页的任务量&#xff01; 由于刚开始接触知识图谱&#xff0c;尚未学习N…

python找出录取率最高的年份_Python分析42年高考数据,告诉你高考为什么这么难?...

不同省份的985和211录取率有着比较明显的差距&#xff0c;12个省份的985录取率低于1.5%&#xff0c;安徽&#xff0c;河南&#xff0c;江苏和贵州更是低于1.2%大数据文摘授权转载自数据森麟作者&#xff1a;徐麟对于已经工作的“上班族”来说&#xff0c;6月7号到9号三天无疑是…

知识图谱入门视频(四)

学习内容 小象学院 b站 问题 本体和实体的区别&#xff1f; 苹果公司是一个科技公司&#xff0c;那么苹果公司就是一个实体&#xff0c;它所对应的科技公司就是本体概念。分布式表示和分布式存储 前者是将语义连续化&#xff0c;后者则是一个存不下&#xff1b; 第四部分 应…

FMS3系列(三):创建基于FMS的流媒体播放程序

本文主要介绍怎么去创建基于FMS的流媒体播放程序&#xff0c;Flash客户端通过网络加载FMS服务器上的视频流文件(.flv,.mp4等)&#xff0c;实现视频流的播放。 要实现媒体流文件的播放是非常简单的&#xff0c;只要在FMS服务器上提供好流媒体文件&#xff0c;Flash客户端通过Net…

kakfa怎么看消息是否堆积_纯种哈士奇多少钱一只,怎么看是否是纯种哈士奇

纯种哈士奇多少钱一只&#xff0c;怎么看是否是纯种哈士奇哈士奇之前是一种生存在高寒地带的工作犬&#xff0c;近些年迅速占领了家庭宠物的市场&#xff0c;成为最受欢迎的宠物犬之一&#xff0c;由于它精力过于旺盛而且服从性极地因此也让很多人头痛。但是这并不能让人们减少…

论文阅读笔记(二)【ACL2021】知识抽取NER

学习内容 由于刚刚进入知识图谱领域&#xff0c;对该领域的研究热点不是很了解&#xff0c;所以本文直接翻译ACL2021中关于知识抽取NER中各个论文的摘要和共享&#xff1b;并且适时在最后写出自己的理解&#xff1b;同时自己也会在了解完全部后给出各个论文的研究分类。 1. 题…

SQL Server 2000中的数据转换服务 (DTS)

SQL Server 2000中的数据转换服务 (DTS) 更新日期&#xff1a; 2004年06月15日发布者 Diane LarsenEuan Garden, 投稿人 Microsoft Corporation 2000 年 9 月 摘要&#xff1a; 为了完成数据合并、存档和分析等任务&#xff1b;为了进行应用程序开发&#xff1b;为了进行数据库…

LeetCode 599. 两个列表的最小索引总和(哈希map)

1. 题目 假设Andy和Doris想在晚餐时选择一家餐厅&#xff0c;并且他们都有一个表示最喜爱餐厅的列表&#xff0c;每个餐厅的名字用字符串表示。 你需要帮助他们用最少的索引和找出他们共同喜爱的餐厅。 如果答案不止一个&#xff0c;则输出所有答案并且不考虑顺序。 你可以假…

python odoo_odoo python 使用缓存

from tools.com_cache import cache, ctime, timeblock# 使用SQL来取得指定商品在指定仓库的库存数量def get_warehouse_stock_qty(self,warehouse_id):self.ensure_one()# 从缓存中查询&#xff0c;如有cache_data cache.warehouse_stock_qty.get([self.id,warehouse_id])if …

项目经理(project manager)刘小备的一天

背景介绍说明:人物:部门经理:汉小帝刘正系统实施部经理:陶小谦项目经理(project manager):刘小备软件Software工程师:关小羽张小飞赵小云马小超黄小忠任务:为江东通信公司开发套管理平台软件Software江东通信公司接口人:鲁小肃时间:2007年某某月某某天当前状态:项目在编码阶段进…

李宏毅机器学习(一)基本概念介绍

学习内容 这是第二次看机器学习的内容&#xff0c;所以这里主要记录的是让我印象深刻的知识点&#xff1b; 但是有两个问题&#xff1a; deep&#xff1f; 为什么不是越深越好&#xff1f;fat&#xff1f; 为什么要套娃&#xff0c;我们只需要将多个sigmoid并排不就好了吗&am…

灰色关联分析_灰色关联分析模型研究综述

灰色关联分析模型研究小结1 引言灰色关联分析是灰色系统理论中十分活跃的一个分支, 其基本思想是根据序列曲线几何形状来判断不同序列之间的联系是否紧密. 基本思路是通过线性插值的方法将系统因素的离散行为观测值转化为分段连续的折线, 进而根据折线的几何特征构造测度关联程…

LeetCode 622. 设计循环队列

1. 题目 设计你的循环队列实现。 循环队列是一种线性数据结构&#xff0c;其操作表现基于 FIFO&#xff08;先进先出&#xff09;原则并且队尾被连接在队首之后以形成一个循环。 它也被称为“环形缓冲器”。 循环队列的一个好处是我们可以利用这个队列之前用过的空间。 在一个…

solidworks模板_工程师实用高级操作,Solidworks自定义属性链接到工程图模板

下面&#xff0c;我以一个非常简单的零件为例&#xff0c;为大家介绍如何在工程图中链接这些属性。来达到减少工作量节省工作时间的目的。1.这是1个简单的零件&#xff0c;零件的自定义零件属性都已经填写完成。2.制作该零件的工程图文件&#xff0c;这里我以SolidWorks中默认的…

简单的脚本控制面试题

版面上有一个button,一个div,单击button,div中显示当前日期 答案: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns"http://www.w3.org/1999/xht…

知识图谱入门知识(二)事件抽取(EE)详细介绍

学习内容 本文主要详细介绍事件抽取EE的概念&#xff1b; 装载自&#xff1a;李景鹏 啥是事件抽取(Event Extraction)&#xff1f; 同时这里关于事件抽取的介绍也可以作为补充&#xff1a; 分层网络用于事件参数抽取 事件抽取 事件提取&#xff08;Event Extraction EE&…

post和get传值

//post传值send.aspx: if (e.CommandName "ChaXun") { LinkButton Lik(LinkButton)e.Item.FindControl("LinkButton1"); Context.Items["username"] Lik.CommandArgument.ToString(); Server.Transfer…