[2-03-03].第02节:ES初识 - ElasticSearch概念

ElasticSearch学习大纲


二、ES中的核心概念:

2.1.Lucene和Elasticsearch:

Lucene:

  • 最先进、功能最强大的搜索库,如果直接基于lucene开发,非常复杂,api复杂

b.Elasticsearch:

  • 基于lucene,封装了许多lucene底层功能,提供简单易用的restful api接口和许多语言的客户端,如java的高级客户端(Java High Level REST Client)和底层客户端(Java Low Level REST Client)

2.2.ES中的核心概念:

概念1:文档:

  • 1.Elasticsearch是面向文档(Document)存储的,可以是数据库中的一条商品数据,一个订单信息
  • 2.文档数据会被序列化为json格式后存储在elasticsearch中
  • 3.在JSON文档中往往包含很多的字段(Field),类似于数据库中的列。对于上面表格,每一行是一个文档,每一列是一个字段
  • 3.文档是ES中的最小数据单元。一个document就像数据库中的一条记录。通常以json格式显示。多个document文档存储于一个索引(Index)中
book document { "book_id": "1", "book_name": "java编程思想", "book_desc": "从Java的基础语法到最高级特性(深入的[面向对象](https://baike.baidu.com/item/面向对象)概念、多线程、自动项目构建、单元测试和调试等),本书都能逐步指导你轻松掌握。", "category_id": "2", "category_name": "java" }

概念2:索引

  • 1.索引就是相同类型的文档的集合,类似于mysql的表,例如:
    • 所有用户文档,就可以组织在一起,称为用户的索引;
    • 所有商品的文档,可以组织在一起,称为商品的索引;
    • 所有订单的文档,可以组织在一起,称为订单的索引;
  • 2.一个索引由一个名字来标识(必须全部是小写字母),并且当我们要对这个索引中的文档进行索引、搜索、更新和删除的时候,都要使用到这个名字。在一个集群中,可以定义任意多的索引
  • 3.能搜索的数据必须索引,这样的好处是可以提高查询速度,比如:新华字典前面的目录就是索引的意思,目录可以提高查询速度。
  • 4.索引创建规则:
    • 仅限小写字母
    • 不能包含\、/、 *、?、"、<、>、|、#以及空格符等特殊符号
    • 从7.0版本开始不再包含冒号
    • 不能以-、_或+开头
    • 不能超过255个字节(注意它是字节,因此多字节字符将计入255个限制)

概念3:mapping 映射:

  • 1.数据库的表会有约束信息,用来定义表的结构、字段的名称、类型等信息。那么在索引库中就有映射(mapping),是索引中文档的字段约束信息,类似表的结构约束是处理数据的方式和规则方面做一些限制
  • 2.映射举例如:某个字段的数据类型、默认值、分析器、是否被索引等等。这些都是映射里面可以设置的,其它就是处理 ES 里面数据的一些使用规则设置也叫做映射,按着最优规则处理数据对性能提高很大,因此才需要建立映射,并且需要思考如何建立映射才能对性能更好。

概念5:Type:类型

  • 1.每个索引里都可以有一个或多个type,type是index中的一个逻辑数据分类,一个type下的document,都有相同的field。
  • 2.注意:6.0之前的版本有type(类型)概念,type相当于关系数据库的表,ES官方将在ES9.0版本中彻底删除type。本教程type都为_doc

2.3.ES与MySQL概念对比:

a.数据格式对比:

关系型数据库(比如Mysql)非关系型数据库(Elasticsearch)非关系型数据库(Elasticsearch)
表Table索引Index(原为Type)索引(index),就是文档的集合,类似数据库的表(table)
数据行Row文档Document文档(Document),就是一条条的数据,类似数据库中的行(Row),文档都是JSON格式
数据列Column字段Field字段(Field),就是JSON文档中的字段,类似数据库中的列(Column)
约束 Schema映射MappingMapping(映射)是索引中文档的约束,例如字段类型约束。类似数据库的表结构(Schema)
SQLDSLDSL是elasticsearch提供的JSON风格的请求语句,用来操作elasticsearch,实现CRUD

b. 应用场景对比:


2.4.其他概念:

a.NRT:

  • 1.NRT意思就是近实时
  • 2.近实时体现在两方面:
    • 写入数据时,过1秒才会被搜索到,因为内部在分词、录入索引。
    • Es搜索时:搜索和分析数据需要秒级出结果。

b.Node(节点):

  • 1.每个服务器上的ES实例称为一个节点。节点名自动分配,也可以手动配置

c.Cluster(集群)

  • 1.包含一个或多个启动着ES实例的机器群。通常一台机器起一个ES实例
  • 2.同一网络下,集名一样的多个es实例自动组成集群,自动均衡分片等行为,默认集群名为“elasticsearch”

d.shard:分片

  • 1.index数据过大时,将index里面的数据,分为多个shard,分布式的存储在各个服务器上面。可以支持海量数据和高并发,提升性能和吞吐量,充分利用多台机器的cpu。

f.replica:副本

  • 1.在分布式环境下,任何一台机器都会随时宕机,如果宕机,index的一个分片没有,导致此index不能搜索。所以,为了保证数据的安全,我们会将每个index的分片经行备份,存储在另外的机器上。保证少数机器宕机es集群仍可以搜索。
  • 2.能正常提供查询和插入的分片我们叫做主分片(primary shard),其余的我们就管他们叫做备份的分片(replica shard)
  • 3.Es6默认新建索引时,5分片,2副本,也就是一主一备,共10个分片。所以,Es集群最小规模为两台

g.分配(Allocation)

  • 1.将分片分配给某个节点的过程,包括分配主分片或者副本。如果是副本,还包含从主分片复制数据的过程。这个过程是由 master 节点完成的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1164277.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Paperzz 开题报告|AI 赋能学术起点,一键开启你的论文高效创作之旅

Paperzz-AI官网免费论文查重复率AIGC检测/开题报告/文献综述/论文初稿 paperzz - 开题报告https://www.paperzz.cc/proposal 在学术研究的漫漫长路上&#xff0c;开题报告是叩响知识殿堂的第一扇门。它不仅是对研究方向的精准锚定&#xff0c;更是后续论文写作的蓝图与基石。但…

基于单片机的防火防盗报警系统

摘 要 随着社会和经济的发展&#xff0c;防火工作越来越重要&#xff0c;但是目前国内的许多研发都侧重于大型场所的火灾报警。因此&#xff0c;我们就有必要研制一种结构简单、经济实用的家庭烟雾报警器以适应市场的需求。基于供家庭使用的烟雾报警器应该具备的基本要求和功能…

钉钉的AI赋能办公

一、 钉钉AI的核心形态&#xff1a;从“指令”到“托管”钉钉的AI赋能主要经历了从 Chat&#xff08;对话&#xff09; 到 Agent&#xff08;助理&#xff09;&#xff0c;再到现在的 Workflow&#xff08;流转&#xff09; 三个阶段。1.1 个人级&#xff1a;你的“数字双胞胎”…

Node.js用os.cpus()轻松获取CPU核心数

&#x1f493; 博客主页&#xff1a;瑕疵的CSDN主页 &#x1f4dd; Gitee主页&#xff1a;瑕疵的gitee主页 ⏩ 文章专栏&#xff1a;《热点资讯》 Node.js的os.cpus()&#xff1a;从静态核心数到动态计算资源的演进与挑战目录Node.js的os.cpus()&#xff1a;从静态核心数到动态…

【广东省高等教育学会人工智能与高等教育研究分会主办 | IEEE出版 | 往届已完成EI核心检索,快至会后3个月检索】第三届智慧城市与信息系统国际学术会议 (ICSCIS 2026)

第三届智慧城市与信息系统国际学术会议 (ICSCIS 2026) 2026 3rd International Conference on Smart City and Information System 2026年1月30-2月1日 中国广州 大会官网&#xff1a;www.icscis.net【论文投稿】 截稿时间&#xff1a;见官网 主办单位&#xff1a;广东省…

什么是大模型?——AI的“超级大脑“全面解析,从入门到精通

本文系统介绍了大模型的概念、特征、与小模型的区别、涌现能力、工作原理、应用领域及未来趋势。大模型是拥有数十亿至数千亿参数的深度学习模型&#xff0c;通过预训练、微调和对齐三个阶段工作&#xff0c;具备跨领域泛化能力。随着参数规模扩大&#xff0c;AI展现出涌现能力…

车企AI市场分析榜单:原圈科技领衔,决胜2026营销变革

在2026年激烈的汽车市场竞争中,AI市场分析成为关键。本文深度盘点主流系统,其中原圈科技凭借其在技术能力、行业应用深度及客户实证效果的突出表现,被视为领先解决方案。榜单将为您揭示各系统优劣,为车企智能化营销转型提供决策依据。2026车企智胜未来:AI市场分析系统深度榜单引…

77.8分SOTA!Qwen3-VL多模态检索模型技术详解与实战应用

Qwen3-VL-Embedding和Reranker是基于Qwen3-VL的多模态检索与排序模型&#xff0c;采用双塔和单塔架构&#xff0c;在MMEB-V2基准测试中取得77.8分SOTA成绩。支持文本、图像、视频等多模态输入&#xff0c;通过MRL和QAT技术实现高效推理。文章详细解析了模型架构、训练策略和实现…

Android 基础入门教程2.5.5 ExpandableListView(可折叠列表)的基本使用

2.5.5 ExpandableListView(可折叠列表)的基本使用 分类 Android 基础入门教程 本节引言&#xff1a; 本节要讲解的Adapter类控件是ExpandableListView&#xff0c;就是可折叠的列表&#xff0c;它是ListView的子类&#xff0c; 在ListView的基础上它把应用中的列表项分为几组…

大模型完全解析:从小白到AI入门的必学知识体系

本文系统解析AI与大模型核心概念&#xff0c;从AI定义、大模型原理、GPT本质、AIGC应用到算力与Token等基础知识入手&#xff0c;清晰阐述AI发展的三个阶段(弱人工智能、强人工智能、超强人工智能)及当前所处位置&#xff0c;为读者提供结构化、易懂的AI入门指南。最全AI科普&a…

干货收藏!2026网络安全新机遇:AI技术引领高薪就业新时代

干货收藏&#xff01;2026网络安全新机遇&#xff1a;AI技术引领高薪就业新时代 文章分析2026年专科专业新增趋势&#xff0c;指出AI、智能化和数字经济相关专业成为热点。技术人才就业前景广阔&#xff0c;得益于政策支持、人才缺口扩大和薪资上涨。黑马程序员培训机构推出融…

Android 基础入门教程2.5.6 ViewFlipper(翻转视图)的基本使用

2.5.6 ViewFlipper(翻转视图)的基本使用 分类 Android 基础入门教程 本节引言&#xff1a; 本节给大家带了的是ViewFlipper&#xff0c;它是Android自带的一个多页面管理控件&#xff0c;且可以自动播放&#xff01; 和ViewPager不同&#xff0c;ViewPager是一页页的&#xf…

pytest框架:mark标记功能

&#x1f345; 点击文末小卡片&#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 一、mark标记在实际工作中&#xff0c;我们要写的自动化用例会比较多&#xff0c;也不会都放在一个py文件中&#xff0c;如果有几十个py文件&#xff0c;上百个方…

新手必看!2026年这3张入门级网安证书,让你轻松踏入网络安安全行业

新手必看&#xff01;2026年这3张入门级网安证书&#xff0c;让你轻松踏入网络安全行业 如果你正准备进入网络安全行业&#xff0c;却还在纠结该考哪张证书作为起点&#xff0c;那么这篇文章会给你清晰的答案。 2026年&#xff0c;网络安全人才缺口依旧巨大&#xff0c;而对新…

初级网络安全工程师必看:全网最强的SSRF+XXE漏洞挖掘笔记教程,黑客技术零基础入门到精通实战!

一、Server-side request forgery (SSRF) 01、Basic SSRF against the local server 描述 该实验室具有库存检查功能&#xff0c;可从内部系统获取数据。 为了解决实验室&#xff0c;更改股票检查 URL 以访问管理界面http://localhost/admin并删除用户carlos。 解决方案 …

课程论文别再 “凑字数”!宏智树 AI:三步写出导师点赞的高分学术答卷

学期末的课程论文&#xff0c;堪称大学生的 “学术初体验”。但不少同学的写作状态却是&#xff1a;选题靠 “蒙”&#xff0c;文献靠 “堆”&#xff0c;查重靠 “改”&#xff0c;最后交出的论文要么是 “教材内容复刻版”&#xff0c;要么是 “网络观点拼盘”&#xff0c;不…

Android 基础入门教程2.5.7 Toast(吐司)的基本使用

2.5.7 Toast(吐司)的基本使用分类 Android 基础入门教程本节引言&#xff1a;好的&#xff0c;终于学习完Adapter类相关的一些控件&#xff0c;当然除了讲解的那几个&#xff0c;还有其他很多的 相关的控件&#xff0c;就不慢慢讲解了~有需要的自行查阅文档&#xff0c;查看相关…

基于单片机的可调直流稳压电源

2 系统的总体设计 2.1 系统的设计思路 对于单片机的调节基础之上&#xff0c;可以设置出对应的结构&#xff0c;可以发泄在结构图当中&#xff0c;这是一个非常完整的系统&#xff0c;并且主要通过由单片机模块显示电压模块以及电源模块及电源模块等进行组成&#xff0c;在设计…

基于单片机的楼宇智能照明系统

摘 要 近年来现代化建设颇具成效。城市发展建设作为现代化建设的重要一角&#xff0c;不仅仅在城市定位、技术革新、降低能耗等方面努力争先&#xff0c; 也在文化建设方面大放异彩。而智能楼宇作为高质量生活不可或缺的一环&#xff0c;智能照明也随之变得格外重要&#xff0…

白蚁监测仪:能根据长期监测数据预测白蚁的活动趋势和繁殖周期

白蚁虽小&#xff0c;危害却极大&#xff0c;它们悄无声息地蛀蚀建筑、树木&#xff0c;等人们察觉时&#xff0c;往往已造成难以挽回的损失。白蚁监测仪的出现&#xff0c;为应对这一难题提供了有效手段。白蚁监测仪运用了先进的生物传感与智能监测技术。其内部设有特制的诱饵…