Java_ElasticSearch(ES)——分布式搜索引擎

介绍:

Elasticsearch是一个开源的分布式搜索和分析引擎,最初由Elastic公司开发。它构建在Apache Lucene搜索引擎库之上,提供了一个强大的全文搜索和分析引擎,它结合kibana、Logstash、Beats,是一整套技术栈,被叫做ELK,适用于各种用例,包括文本搜索、日志分析、实时数据分析、监控和报警等。

官网:

官网地址:Elastic — The Search AI Company | Elastic,目前最新的版本是8.x.x,国内大多使用6.x.x和7.x.x。

优势:

elasticsearch具备以下优势:

**·**支持分布式。可水平拓展

**·**提供Restful接口,可被任何语言调用

es在处理海量数据搜索时,速度非常的快,是因为它底层采用倒排索引。

★倒排索引:

首先介绍一下正向索引

倒排索引

总结:

IK分词器:

上述配置文件即表示添加扩展词典ext.dic,它就会在当前配置文件所在的目录中找这个文件。

总结:

基础概念:

与MySQL对比:

索引库操作

Mapping映射属性:

索引库操作:

总结:

文档处理:

CRUD:

新增:

查找、删除:

修改:
全量修改:

这种方式在文档id不存在时,就会相当于一个新增操作。

增量修改:

批量处理:

JavaRestClient:

客户端初始化:

商品表Mapping映射:

以商品表举例:

在kibana中写出即为:

PUT /items { "mappings": { "properties": { "id": { "type":"keyword" }, "name":{ "type": "text", "analyzer": "ik_smart" }, "price":{ "type": "integer" }, "image":{ "type": "keyword", "index": false }, "category":{ "type": "keyword" }, "brand":{ "type": "keyword" }, "sold":{ "type": "integer" }, "comment_count":{ "type": "integer", "index": false }, "isAD":{ "type": "boolean" }, "update_time":{ "type": "date" } }

索引库操作:

创建索引库的JavaAPI与Restful接口API对比:

操作步骤:

代码演示:
class ItemTest { private RestHighLevelClient client; @BeforeEach void setUp() { // 初始化 RestHighLevelClient 对象 client = new RestHighLevelClient(RestClient.builder( HttpHost.create("http://192.168.178.130:9200") )); } @AfterEach void tearDown() throws IOException { client.close(); } @Test void testCreateIndex() throws IOException { //1.准备Request对象 CreateIndexRequest request = new CreateIndexRequest("items"); //2.准备请求参数 request.source(MAPPING_TEMPLATE, XContentType.JSON); //3.发送请求 client.indices().create(request, RequestOptions.DEFAULT); } @Test void testGetIndex() throws IOException { //1.准备Request对象 GetIndexRequest request = new GetIndexRequest("items"); //2.发送请求 boolean exists = client.indices().exists(request, RequestOptions.DEFAULT); System.out.println("exists: " + exists); } @Test void testDeleteIndex() throws IOException { //1.准备Request对象 DeleteIndexRequest request = new DeleteIndexRequest("items"); //2.发送请求 client.indices().delete(request, RequestOptions.DEFAULT); } private static final String MAPPING_TEMPLATE = "{ " + " "mappings": { " + " "properties": { " + " "id": { " + " "type":"keyword" " + " }, " + " "name":{ " + " "type": "text", " + " "analyzer": "ik_smart" " + " }, " + " "price":{ " + " "type": "integer" " + " }, " + " "image":{ " + " "type": "keyword", " + " "index": false " + " }, " + " "category":{ " + " "type": "keyword" " + " }, " + " "brand":{ " + " "type": "keyword" " + " }, " + " "sold":{ " + " "type": "integer" " + " }, " + " "comment_count":{ " + " "type": "integer", " + " "index": false " + " }, " + " "isAD":{ " + " "type": "boolean" " + " }, " + " "update_time":{ " + " "type": "date" " + " } " + "} " + "} " + "}"; }

文档操作:

新增文档:

运行代码:
@SpringBootTest(properties = "spring.profiles.active=local") class ESDocTest { private RestHighLevelClient client; @Autowired private IItemService itemService; @BeforeEach void setUp() { // 初始化 RestHighLevelClient 对象 client = new RestHighLevelClient(RestClient.builder( HttpHost.create("http://192.168.178.130:9200") )); } @AfterEach void tearDown() throws IOException { client.close(); } @Test void testIndexDoc() throws IOException { //获取数据 Item item = itemService.getById(317578L); ItemDoc itemDoc = BeanUtil.copyProperties(item, ItemDoc.class); //创建request对象 IndexRequest request = new IndexRequest("item").id(itemDoc.getId()); //准备JSON文档 request.source(JSONUtil.toJsonStr(itemDoc), XContentType.JSON); //发送请求 client.index(request, RequestOptions.DEFAULT); } }
删除文档:

查询文档:

修改文档:

全量更新:可以使用新增文档的代码,在得到ItemDoc后修改它的属性值在新增即可。

局部更新:

文档操作基本步骤:

批处理:

代码示例:

DSL查询:

快速入门:

注意:单次查询默认最大数据数为10000,最多返回10条数据

叶子查询:

全文检索:

FIELD为要搜索的字段,TEXT为要搜索的内容

精确查询:

term查询一般用来搜不分词的字段,比如品牌等。如果搜分词的字段,VALUE只能写分好的词条,比如“脱脂”、“牛奶”等,才能搜到

range查询中gte和lte也可以写成gt和lt这样就是大于和小于。

ids查询:(批量查询id)

总结:

复合查询:

布尔查询:

示例:

搜索“智能手机”,但品牌必须是华为,价格必须是900~1599

排序和分页:

排序:

示例:

搜索商品,按照销量排序,销量一样则按照价格排序。

分页:

示例:

搜索商品,查询出销量排名前10的商品,销量一样时按照价格升序。

深度分页问题:

解决方案:

高亮显示:

(↑标签默认就为em)

搜索完整语法:

JavaRestClient查询:

快速入门:

构建查询条件:

全文检索查询:

精确查询:

布尔查询:

排序和分页:

高亮显示:

聚合:

聚合的分类:

DSL实现聚合:

Java客户端实现聚合:

构造请求参数:

解析结果:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1125465.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

手写一个单例模式 (考虑线程安全)。

手写一个单例模式 (考虑线程安全) 关键词:单例模式, 线程安全, 设计模式, 双重检查锁定, 并发编程, 懒汉式, 饿汉式 摘要:单例模式是软件开发中最基础也最常用的设计模式之一,它保证一个类在整个系统中只有一个实例,并提供全局访问点。然而在多线程环境下,简单的单例实现可…

一个在使用方法上的低级错误(MySQL场景)

首先申明这个技术含量不高初始化问题数据。注意这里的t代表时间,数据类型是字符串。为什么用字符串来表示时间?那这就是问题所在。当初创建的人不懂。这个回答不知道满意吗?mysql> create table t1 (id int,t varchar(20)); Query OK, 0 r…

深度学习毕设选题推荐:基于python的CNN训练识别吃的美食基于深度学习的CNN训练识别吃的美食

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

深度学习毕设项目推荐-深度学习基于python的CNN训练识别吃的美食基于python的深度学习CNN训练识别吃的美食

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

救命神器!9个AI论文网站测评:本科生毕业论文全攻略

救命神器!9个AI论文网站测评:本科生毕业论文全攻略 学术写作新选择:AI论文网站测评全解析 在当前高校教育日益重视科研能力的背景下,本科生在撰写毕业论文时面临诸多挑战,如选题困难、资料查找繁琐、格式规范不熟悉等。…

ReadView的结构和工作原理?

你想深入掌握 Read View 的结构和工作原理,这是理解 MVCC 快照读的核心 ——Read View 就像 MVCC 的 “版本安检员”,决定了当前事务能看到版本链中的哪个版本。接下来我会先拆解 Read View 的核心结构,再用通俗的逻辑 实例讲清它的工作原理…

Java 进阶:如何让线程主动让出 CPU

Java 进阶如何让线程主动让出 CPU ThreadsleepThreadyieldThreadcurrentThreadsuspendObjectwaitLockSupportparkThreadstop Java 进阶:如何让线程主动让出 CPU Thread.sleep sleep 方法可以让线程主动让出 CPU,但是并不会释放锁。 /*** Causes the …

AngularJS 模块详解

AngularJS 模块详解 引言 AngularJS 是一个强大的JavaScript框架,用于构建单页应用程序(SPA)。它提供了一套丰富的特性,其中包括模块化。模块化是现代软件开发的一个重要概念,它有助于提高代码的可维护性和可扩展性。本文将详细解析 AngularJS 模块的概念、创建和使用方…

救命神器!自考必看TOP9 AI论文网站测评与推荐

救命神器!自考必看TOP9 AI论文网站测评与推荐 2026年自考论文写作工具测评:为何需要这份榜单? 随着人工智能技术的不断进步,AI论文写作工具在学术领域的应用越来越广泛。对于自考学生而言,撰写高质量论文不仅是毕业的必…

idea创建springBoot的五种方式

目录 第一种 第二种 第三种 第四种 第五种 1.先创建一个普通的mavenjava项目 2.pom.xml 3.启动类 4.controller 5.运行访问 第一种 idea直接从spring.io官网下载 https://start.spring.io/ 使用jar包创建就行,也是maven项目,jdk选1.8&#…

Java实战:Spring Boot application.yml配置文件详解

本文将详细介绍Spring Boot application.yml 配置文件的使用和配置项。我们将探讨 application.yml 文件的基本概念,以及如何使用它来配置Spring Boot应用程序的各个方面。此外,我们将通过具体的示例来展示如何配置不同的Spring Boot组件,如数…

idea、mybatis报错Property ‘sqlSessionFactory‘ or ‘sqlSessionTemplate‘ are required

这个错误通常与MyBatis的配置有关,涉及到MyBatis的SqlSessionFactory或SqlSessionTemplate的配置问题。以下是一些可能的解决方案: 1.检查DataSource配置: 确保你的数据源(DataSource)被正确配置。在Spring Boot中&…

Azure GPv1 存储账户迁移至 GPv2 完整指南

概述 Microsoft Azure 将于 2026年10月13日 正式退役通用用途 v1(General-purpose v1,GPv1)存储账户。所有用户必须在此日期前将 GPv1 存储账户升级至通用用途 v2(General-purpose v2,GPv2),以避免服务中断和潜在的成本增加。 为什么需要迁移? 退役时间线 截止日期:…

Java学习进阶知识篇

系列文章目录 提示:....................... 文章目录 系列文章目录前言一、类和对象 面向对象基本介绍类的基本使用属性构造方法和析构方法对象 二、总结 前言 提示:这里可以添加本文要记录的大概内容: Java面向对象编程的进阶知识 一、…

Prompt Tuning动态选医疗特征提速诊断

📝 博客主页:Jax的CSDN主页 Prompt Tuning动态选医疗特征提速诊断 目录Prompt Tuning动态选医疗特征提速诊断 引言:诊断效率的全球性挑战 技术原理:动态特征选择的机制创新 现实应用:2023年临床试点的突破性验证 挑战与…

Memcached 连接:深入理解与优化实践

Memcached 连接:深入理解与优化实践 引言 Memcached 是一种高性能的分布式内存对象缓存系统,它能够存储键值对,广泛应用于减轻数据库负载、提高系统响应速度等方面。在Memcached的应用中,连接的建立和维护是至关重要的。本文将深入探讨Memcached连接的原理、优化策略以及…

深度学习计算机毕设之基于python训练鲜花识别基于卷神经网络训练鲜花识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

HeidiSQL导入与导出数据

HeidiSQL两种导入与导出数据的方法:整个库复制,和仅复制数据 一 整个库复制 1 选中需要导出的数据库(这里是MyDBdata),点击导出为SQL脚本。2 按照如图进行选择3 选做:删除当前数据库【如果有】 -- 删除数据库 USE mysql; DROP DAT…

2026最全Gemini学生优惠申请指南

Google 在 2025 年正式推出 Gemini 学生优惠计划,符合条件的学生可在2026年1月31日前通过认证免费获得价值约 $300 的 Google AI Pro 服务长达 15 个月。这意味着你可以零成本使用:Gemini Advanced(2.5 Pro / 3 系列模型)2TB Goog…

毫米波V2I网络的链路层仿真研究(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…