知识图谱入门视频(二)

学习内容

小象学院 b站 第二章
【其实后面的方法学习只是一个框架式的学习,并不明白具体的操作】

第二部 典型知识库项目简介

在这里插入图片描述

CYC(读音: 赛克)

  • CYC: 1984年由Douglas Lenat开始创建,最初的目标是建立人类最大的常识知识库。该知识库主要由术语Terms和断言Assertions组成。

  • Cyc的主要特点是基于形式化的知识表示方法来刻画知识。形式化的优势是可以支持复杂的推理。但过于形式化也导致知识库的扩展性和应用的灵活性不够。Cyc提供开放版本的OpenCyc

Wordnet

  • WordNet是最著名的词典(lexical)知识库,主要用于词义消歧,1985年提出的。

  • WordNet主要定义了名词、动词、形容词和副词之间的语义关系。 例如名词之间的上下位关系(如: 猫科动物是猫的上位词),动词之间的蕴涵关系(如:打鼾蕴含着睡眠)等

  • WordNet已经包含超过了15万个词和20万个语义关系。

在这里插入图片描述

ConceptNet

  • ConceptNet是常识知识库。来源于OMCS项目。1999年创立
  • ConceptNet主要依靠互联网众包、专家创建和游戏三种方法来构建。新版本导入了大量开放的结构化数据,如DBPedia、WordNetdeng
  • ConceptNet知识库以三元组形式的关系型知识构成。ConceptNet5版本已经包含有2800万关系描述。与Cyc相比,ConceptNet采用了非形式化、更加接近自然语言的描述,而不是像Cyc那样采用形式化的谓词逻辑
  • 与链接数据和谷歌知识图谱相比,ConceptNet比较侧重于词与词之间的关系。从这个角度看,ConceptNet更加接近于WordNet,但是又比WordNet包含的关系多。此外,ConceptNet完全免费开放,并支持多种语言。

Freebase

在这里插入图片描述
三元组:我们理解为主谓宾

Wikidata

在这里插入图片描述

DBPedia

  • DBPedia是早期的语义网项目。DBPedia意指数据库版本的Wikipedia,是从Wikipedia抽取出来的链接数据集。DBPedia采用了一个较为严格的本体,包含人、地点、音乐、电影、组织机构、物种、疾病等类定义
  • 此外,DBPedia还与Freebase、OpenCYC、Bio2RDF等多个数据集建立了数据链接。 DBPedia采用RDF语义数据模型,总共包含30亿RDF三元组。

三元组:我们理解为主谓宾

YAGO

链接
在这里插入图片描述
我们还添加了各种时间关系,比如奥巴马是多少年任期的; 鹿晗和关晓彤是多少年在一起的。

BabelNet

  • BabelNet是类似于WordNet的多语言词典知识库。BabelNet的目标是解决WordNet在非英语语种中数据缺乏的问题。BabelNet采用的方法是将WordNet词典与Wikipedia百科集成
  • 首先建立WordNet中的词与Wikipedia的页面标题的映射,然后利用Wikipedia中的多语言链接,再辅以机器翻译技术,来给WordNet增加多种语言的词汇
  • BabelNet3.7包含了271中语言,1400万同义词组,36,4万词语关系和3.8亿从Wikipedia中抽取的链接关系,总计超过19亿RDF三元组。继承了上面两个数据库的优点,构建了目前最大规模的多语言词典知识库。
    我们可以利用同义词来重构搜索条件
    在这里插入图片描述

NELL

在这里插入图片描述
这里是自动在web上抽取三元组知识;但是需要知识抽取(bootstrap)来进行引导。

Concept Graph

  • Concept Graph是以概念层次体系为中心的知识图谱。与Freebase等知识图谱不同,Concept Graph以概念定义和概念之间的IsA关系为主
  • 给定一个概念如“Microsoft”,Concept Graph返回一组与“微软”有ISA关系概念组,如“Company”,“Software Company”,这被称为概念化“Conceptualization”
  • Concept Graph可以用于短文本理解和语义消歧。 如“工程师在吃苹果”,苹果指的是苹果还是苹果公司。

OpenKG:中文知识图谱资源库

Zhishi.me

英文很多,中文很少。 包括百度百科
实体抽取,关系抽取 --》 知识抽取
在这里插入图片描述
我们获取知识后再进行整合,进行互补。
在这里插入图片描述

cnSchema:开放的中文知识图谱Schema

可以自行访问

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/476327.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

InterDev 调试错误信息: Unable to set server into correct debugging state automatically....的解决办法...

InterDev 调试错误信息: Unable to set server into correct debugging state automatically....权威解决方法了:1、安装 vs6.0 cd2 vid_ss/setup.exe 2、安装 vs6.0 cd2 vid_ss/setup.exe3、配置dcom,设置用户权限4、打开IIS的调试功能5、OK详情见微软…

LeetCode 521. 最长特殊序列 Ⅰ

1. 题目 给你两个字符串,请你从这两个字符串中找出最长的特殊序列。 「最长特殊序列」定义如下:该序列为某字符串独有的最长子序列(即不能是其他字符串的子序列)。 子序列 可以通过删去字符串中的某些字符实现,但不…

wordpress acf字段 不同样式_提升wordpress执行效率二次开发实录

wordpress 对分类增加广告配置功能 wp_terms 增加admaster字段 varchar 200 wp-admin/edit-tag-form.php 小资料: wordpress wp_terms分类表 wp_term_taxonomy分类类型表、wp_term_relationships分类关联表 这三个表单相互关联 wordpress优化效率 当wordpress执行…

知识图谱入门知识(一)知识图谱应用以及常用方法概述

学习内容 搜集各种博客,理解实体识别、关系分类、关系抽取、实体链指、知识推理等,并且总结各种分类中最常用的方法、思路。 由于自己刚刚接触知识图谱,对该领域的概念和方法的描述还不是很清楚,所以只是简单的列出框架和添加链接…

openMP学习笔记(一)

声明:欢迎任何人和组织转载本blog中文章,但必须标记文章原始链接和作者信息。 本文链接:http://blog.csdn.net/li_007/archive/2009/04/30/4139211.aspx 开拓进取的小乌龟------->CSDN点滴点点滴滴Blog 之前大概看了一下openMP&#xff0c…

LeetCode 532. 数组中的K-diff数对

1. 题目 给定一个整数数组和一个整数 k, 你需要在数组里找到不同的 k-diff 数对。 这里将 k-diff 数对定义为一个整数对 (i, j), 其中 i 和 j 都是数组中的数字,且两数之差的绝对值是 k. 示例 1: 输入: [3, 1, 4, 1, 5], k 2 输出: 2 解释: 数组中有两个 2-diff …

python随机生成六位数密码_python生成6位包含数字和字母的密码

初学python,简单敲了几行生成6位包含数字和字母密码的代码(我是在python 3上敲的)首先理清思路:1、包含数字和字母的六位口令共有36^6个2、将0-9和a-z合成一个字符串pwd,用pwd[0-35]表示所有数字和小写字母,即pwd[0]0,pwd[1]1…pwd[34]y,pwd[…

知识图谱入门视频(三)

学习内容 小象学院 b站 第三章 【其实后面的方法学习只是一个框架式的学习,并不明白具体的操作】 链接 问题: 知识图谱究竟是什么? 可以看看开放知识图谱 其实就是将我们的语言拆分转换为符号表达,之后经过机器学习来将离散式的…

博客新皮肤上市

原创:冰极峰 有朋友说原来的博客不好看,趁着五一节放假,花了点时间重新制作了一套样式,图片借用一个外国博客的图片。 样式全部基于自定义皮肤样式改写的。 说实话,改写博客园样式是一件比较痛苦的事情,你不…

python调用接口测试_Python接口测试实战2 - 使用Python发送请求

本节内容requests安装requests使用JSON类型解析requests库详解带安全认证的请求序言上节课我们学习了接口测试的理论,抓包工具及使用Postman手工测试各种接口,这节课我们主要讲解使用Python语言来发送接口请求,实现接口测试自动化。发送请求,…

LeetCode 551. 学生出勤记录 I

1. 题目 给定一个字符串来代表一个学生的出勤记录,这个记录仅包含以下三个字符: A : Absent,缺勤 L : Late,迟到 P : Present,到场如果一个学生的出勤记录中 不超过一个’A’(缺勤) 并且 不超过两个连续的’L’(迟到…

论文阅读笔记(一)【Journal of Machine Learning Research】Natural Language Processing (Almost) from Scratch(未完)

学习内容 题目: 自然语言从零开始 Natural Language Processing (Almost) from Scratch 2021年7月28日 1-5页 这将是一个长期的过程,因为本文长45页; 每天给自己定为5页的任务量! 由于刚开始接触知识图谱,尚未学习N…

python找出录取率最高的年份_Python分析42年高考数据,告诉你高考为什么这么难?...

不同省份的985和211录取率有着比较明显的差距,12个省份的985录取率低于1.5%,安徽,河南,江苏和贵州更是低于1.2%大数据文摘授权转载自数据森麟作者:徐麟对于已经工作的“上班族”来说,6月7号到9号三天无疑是…

知识图谱入门视频(四)

学习内容 小象学院 b站 问题 本体和实体的区别? 苹果公司是一个科技公司,那么苹果公司就是一个实体,它所对应的科技公司就是本体概念。分布式表示和分布式存储 前者是将语义连续化,后者则是一个存不下; 第四部分 应…

FMS3系列(三):创建基于FMS的流媒体播放程序

本文主要介绍怎么去创建基于FMS的流媒体播放程序,Flash客户端通过网络加载FMS服务器上的视频流文件(.flv,.mp4等),实现视频流的播放。 要实现媒体流文件的播放是非常简单的,只要在FMS服务器上提供好流媒体文件,Flash客户端通过Net…

kakfa怎么看消息是否堆积_纯种哈士奇多少钱一只,怎么看是否是纯种哈士奇

纯种哈士奇多少钱一只,怎么看是否是纯种哈士奇哈士奇之前是一种生存在高寒地带的工作犬,近些年迅速占领了家庭宠物的市场,成为最受欢迎的宠物犬之一,由于它精力过于旺盛而且服从性极地因此也让很多人头痛。但是这并不能让人们减少…

论文阅读笔记(二)【ACL2021】知识抽取NER

学习内容 由于刚刚进入知识图谱领域,对该领域的研究热点不是很了解,所以本文直接翻译ACL2021中关于知识抽取NER中各个论文的摘要和共享;并且适时在最后写出自己的理解;同时自己也会在了解完全部后给出各个论文的研究分类。 1. 题…

SQL Server 2000中的数据转换服务 (DTS)

SQL Server 2000中的数据转换服务 (DTS) 更新日期: 2004年06月15日发布者 Diane LarsenEuan Garden, 投稿人 Microsoft Corporation 2000 年 9 月 摘要: 为了完成数据合并、存档和分析等任务;为了进行应用程序开发;为了进行数据库…

LeetCode 599. 两个列表的最小索引总和(哈希map)

1. 题目 假设Andy和Doris想在晚餐时选择一家餐厅,并且他们都有一个表示最喜爱餐厅的列表,每个餐厅的名字用字符串表示。 你需要帮助他们用最少的索引和找出他们共同喜爱的餐厅。 如果答案不止一个,则输出所有答案并且不考虑顺序。 你可以假…

python odoo_odoo python 使用缓存

from tools.com_cache import cache, ctime, timeblock# 使用SQL来取得指定商品在指定仓库的库存数量def get_warehouse_stock_qty(self,warehouse_id):self.ensure_one()# 从缓存中查询,如有cache_data cache.warehouse_stock_qty.get([self.id,warehouse_id])if …