ElacticSearch入门

ElacticSearch

什么是Elasticsearch?

Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET(C#)、PHP、Python、Apache Groovy、Ruby和许多其他语言中都是可用的。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr,也是基于Lucene。

搜索 全文搜索引擎

库,表,记录

Lucene是一套信息检索工具包 ---- jar包!不包含搜索引擎系统

包含的︰索引结构!读写索引的工具!排序,搜索规则…工具类

Lucene和Elasticsearch关系?

ElacticSearch是基于Lucene做了一些封装和增强

ElacticSearch默认端口是9200

ElacticSearch通信地址:9300

elasticsearch head默认端口:9100

kibana默认端口:5601

存在跨域问题

elasticsearch.yml

http.cors.enabled: true 
http.cors.allow-origin: "*"

ELK是Elasticsearch、Logstash、Kibana三大开源框架(日志分析架构技术栈)

收集清洗数据–>搜索,存储–> Kibana

Elasticsearch是面向文档的

最小单元是文档(row对应数据库中以一行记录)

倒排索引查找文档

常用索引指令

ik分词器

IK提供了两个分词算法:ik_smart和ik_max_word,其中ik_smart为最少切分,ik_max_word为最细粒度划分

GET _analyze
{"analyzer": "ik_max_word","text": "中国共产党"
}

创建一个索引PUT

PUT /test1/type1/1 库名(索引名)/类型名/文档id
{
"name": "躺着数星星",
"age": 20
}
  • 字符串类型

    text 、 keyword

  • 数值类型

    long, integer, short, byte, double, flfloat, half_flfloat, scaled_flfloat

  • 日期类型

    date

  • 布尔值类型

    boolean

  • 二进制类型

    binary

设计一个库(索引规则)

PUT /test2
{"mappings": {"properties": {"name": {"type": "text"},"age": {"type": "long"},"birthday": {"type": "date"}}}
}

可以获取具体的信息,GET

GET /test2

查看默认信息

如果自己的文档字段没有指定,那么es就会给我们默认配置字段类型

PUT /test3/_doc/1
{"name": "躺着数星星","age": 20,"birth": "2000-10-20"
}GET /test3

获取数据库健康值

GET /_cat/health

查看所有信息

GET _cat/indices?v

修改索引PUT

PUT /test1/type1/1
{"name" :"躺着数星星","age": 22}直接修改

POST修改

POST /test3/_doc/1/_update   
{"doc": {"age":22}
}

删除索引DELETE

DELETE /test1

通过DELETE命令实现删除、根据你的请求来判断是删除索引还是删除文档记录

文档基本操作

条件查询

GET /chen/user/_search?q=name:躺着数星星

花式查询

查询的参数体是一个json体

GET chen/user/_search
{"query": {"match": {"name": "躺着数星星"}}
}

hit :索引和文档的信息查询的结果总数,然后就是查询出来的具体的文档

信息过滤

GET chen/user/_search
{"query": {"match": {"name": "詹姆斯"}},"_source": ["tags"]
}

排序

GET chen/user/_search
{"query": {"match": {"name": "詹姆斯"}},"sort": [{"_id": { "order": "desc"    //降序  asc 升序}}]
}

分页查询

GET chen/user/_search
{"query": {"match": {"name": "詹姆斯"}},"sort": [{"_id": {"order": "desc"}}],"from": 0,    //从第0条数据开始"size": 1    //查询1条信息	
}

bool值进行多条件精确查询

must命令(and) 所有条件都要符合

GET chen/user/_search
{"query": {"bool":{"must": [{"match": {"name": "詹姆斯"}},{"match": {"desc": "小皇帝"}}]}}
}

should命令(or)

GET chen/user/_search
{"query": {"bool":{"should": [{"match": {"name": "詹姆斯"}},{"match": {"desc": "小皇帝"}}]}}
}

must_not

GET chen/user/_search
{"query": {"bool":{"must_not": [{"match": {"name": "詹姆斯"}},{"match": {"desc": "小皇帝"}}]}}
}

filter 使用filter进行数据过滤

GET chen/user/_search
{"query": {"bool":{"must_not": [{"match": {"name": "詹姆斯"}}],"filter": {"range": {"age": {"gte": 1,"lte": 3}}}}}
}

匹配多个条件

GET chen/user/_search
{"query": {"match": {"tags": "交友 运动"}}
}

精确查询

term查询是直接通过倒排索引指定的词条进程精确查找

关于分词

  • term ,直接查询精确的
  • match,会使用分词器解析!(先分析文档,然后在通过分析的文档进行查询!)

keyword字段类型不会被分词器解析

多个值匹配的精确查询

GET testdb/_search
{"query": {"bool": {"should": [{"term": {"t1": "22"           }},{                  "term": {            "t1": "33"           }}      ]}}
}

高亮查询

GET chen/user/_search
{"query": {"match": {"name": "詹姆斯"}},"highlight": {"fields": {"name":{}}}
}

自定义高亮条件

GET chen/user/_search
{"query": {"match": {"name": "詹姆斯"}},"highlight": {"pre_tags": "<p class='key' style='color:red'>", "post_tags": "</p>", "fields": {"name":{}}}
}

Springboot操作es

修改es版本

 <properties><java.version>1.8</java.version><!--自定义版本--><elasticsearch.version>7.6.1</elasticsearch.version></properties>

需要导入的依赖

<dependencies><!--解析网页  爬电影 tika--><dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.10.2</version></dependency><dependency><groupId>com.alibaba</groupId><artifactId>fastjson</artifactId><version>1.2.70</version></dependency><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-elasticsearch</artifactId></dependency><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-thymeleaf</artifactId></dependency><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-devtools</artifactId><scope>runtime</scope><optional>true</optional></dependency><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-configuration-processor</artifactId><optional>true</optional></dependency><dependency><groupId>org.projectlombok</groupId><artifactId>lombok</artifactId><optional>true</optional></dependency><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-test</artifactId><scope>test</scope></dependency></dependencies>

创建索引

 @Autowired@Qualifier("restHighLevelClient")  //指定  高级客户端private RestHighLevelClient client;//测试索引的请求 Request@Testvoid testCreateIndex() throws IOException {//创建索引请求CreateIndexRequest request = new CreateIndexRequest("chen_index");//执行创建请求  IndicesClientCreateIndexResponse createIndexResponse = client.indices().create(request, RequestOptions.DEFAULT);System.out.println(createIndexResponse);}

获取索引,判断是否存在

 @Testvoid testExistIndex() throws IOException {GetIndexRequest request = new GetIndexRequest("chen_index");boolean exists = client.indices().exists(request, RequestOptions.DEFAULT);System.out.println(exists);}

删除索引

@Testvoid testDeleteIndex() throws IOException {DeleteIndexRequest request = new DeleteIndexRequest("chen_index");AcknowledgedResponse delete = client.indices().delete(request, RequestOptions.DEFAULT);System.out.println(delete);}

添加文档

@Testvoid testAddDocument() throws IOException {//创建对象User user = new User("chen", 20);//创建请求IndexRequest request = new IndexRequest("chen_index");//规则request.id("1");request.timeout(TimeValue.timeValueSeconds(1)); //延迟 超时request.timeout("1s");//将数据放入请求 json数据request.source(JSON.toJSONString(user), XContentType.JSON);  //转换为json//客户端发送请求IndexResponse indexResponse = client.index(request, RequestOptions.DEFAULT);System.out.println(indexResponse.toString());System.out.println(indexResponse.status());}

获取文档记录

@Testvoid testGetDocument() throws IOException {GetRequest getRequest = new GetRequest("chen_index","1");GetResponse getReponse = client.get(getRequest, RequestOptions.DEFAULT);System.out.println(getReponse.getSourceAsString());System.out.println(getReponse);}

更新文档信息

@Test
void testUpdateDocument() throws IOException {UpdateRequest updateRequest = new UpdateRequest("chen_index","1");updateRequest.timeout("1s");User user = new User("zhangsan", 23);updateRequest.doc(JSON.toJSONString(user),XContentType.JSON);UpdateResponse update = client.update(updateRequest, RequestOptions.DEFAULT);System.out.println(update);System.out.println(update.status());
}

删除文档记录

void testDeleteDocument() throws IOException {DeleteRequest request = new DeleteRequest("chen_index", "1");request.timeout("1s");DeleteResponse delete = client.delete(request, RequestOptions.DEFAULT);System.out.println(delete.status());}

批量插入数据

@Testvoid tsetBulkRequest() throws IOException {BulkRequest bulkRequest = new BulkRequest();bulkRequest.timeout("10s");ArrayList<User> userList = new ArrayList<>();userList.add(new User("chen1", 18));userList.add(new User("chen2", 18));userList.add(new User("chen3", 18));userList.add(new User("chen4", 18));userList.add(new User("chen5", 18));//批处理请求for (int i = 0; i < userList.size(); i++) {bulkRequest.add(new IndexRequest("chen_index").id("" + (i + 1)).source(JSON.toJSONString(userList.get(i)), XContentType.JSON));}BulkResponse bulk = client.bulk(bulkRequest, RequestOptions.DEFAULT);System.out.println(bulk.hasFailures());}

搜索

 @Testvoid testSearchRequest() throws IOException {SearchRequest searchRequest=new SearchRequest("chen_index");//构建搜索条件SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();TermQueryBuilder termQueryBuilder = QueryBuilders.termQuery("name", "chen1");//匹配查询条件//QueryBuilders.matchAllQuery();//查询所有searchSourceBuilder.query(termQueryBuilder);searchSourceBuilder.timeout(new TimeValue(60, TimeUnit.SECONDS));//分页/*searchSourceBuilder.from();searchSourceBuilder.size();*/searchRequest.source(searchSourceBuilder);SearchResponse search = client.search(searchRequest, RequestOptions.DEFAULT);System.out.println(JSON.toJSONString(search.getHits()));for (SearchHit hit : search.getHits().getHits()) {System.out.println(hit.getSourceAsMap());}}
  • SearchRequest搜索请求
  • SearchsourceBuilder条件构造
  • HighlightBuiLder构建高亮
  • TermQueryBuiLlder精确查询

https://github.com/fanjianhai/CODE/tree/main/SpringBoot/springboot-11-elasticsearch-jd

爬取数据︰(获取请求返回的页面信息,筛选出我们想要的数据)

parse和stringfy区别

**一:JSON.parse()【从一个字符串中解析出json对象】

**

例子:

//定义一个字符串

var data=‘{“name”:“goatling”}’

//解析对象

JSON.parse(data)

结果是:

name:“goatling”

二:JSON.stringify()【从一个对象中解析出字符串】

var data={name:‘goatling’}

JSON.stringify(data)

结果是:

‘{“name”:“goatling”}’

解析网页

 String url = "https://search.jd.com/Search?keyword="+"keywords";//解析网页Document document = Jsoup.parse(new URL(url), 3000);  //就是返回的js页面对象Element element = document.getElementById("J_goodsList");//获取所有的li元素  标签Elements elements = element.getElementsByTag("li");//获取元素中的内容 el就是每一个li标签  attr获取属性  eq(0)获取第一个  text文档for (Element el : elements) {String img = el.getElementsByTag("img").eq(0).attr("data-lazy-img");String price = el.getElementsByClass("p-price").eq(0).text();String title = el.getElementsByClass("p-name").eq(0).text();System.out.println(img);System.out.println(price);System.out.println(title);}

axios通信

 axios.get(xxx").then(response=>{});

contentService进行封装

package com.chen.service;import com.alibaba.fastjson.JSON;
import com.chen.pojo.Content;
import com.chen.utils.HtmlParseUtil;
import org.elasticsearch.action.bulk.BulkRequest;
import org.elasticsearch.action.bulk.BulkResponse;
import org.elasticsearch.action.index.IndexRequest;
import org.elasticsearch.action.search.SearchRequest;
import org.elasticsearch.action.search.SearchResponse;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.common.text.Text;
import org.elasticsearch.common.unit.TimeValue;
import org.elasticsearch.common.xcontent.XContentType;
import org.elasticsearch.index.query.QueryBuilders;
import org.elasticsearch.index.query.TermQueryBuilder;
import org.elasticsearch.search.SearchHit;
import org.elasticsearch.search.builder.SearchSourceBuilder;
import org.elasticsearch.search.fetch.subphase.highlight.HighlightBuilder;
import org.elasticsearch.search.fetch.subphase.highlight.HighlightField;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.beans.factory.annotation.Qualifier;
import org.springframework.stereotype.Service;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import java.util.Map;
import java.util.concurrent.TimeUnit;@Service
@SuppressWarnings("all")
public class ContentService {@Autowired@Qualifier("restHighLevelClient")private RestHighLevelClient client;//解析数据放入es索引库中public Boolean parseContent(String keywords) throws IOException {List<Content> contents = new HtmlParseUtil().pareseJD(keywords);//插入到esBulkRequest bulkRequest = new BulkRequest();bulkRequest.timeout("2m");for (int i = 0; i < contents.size(); i++) {bulkRequest.add(new IndexRequest("jd_goods").source(JSON.toJSONString(contents.get(i)), XContentType.JSON));}BulkResponse bulk = client.bulk(bulkRequest, RequestOptions.DEFAULT);return !bulk.hasFailures();}//获取这些数据的搜索功能public List<Map<String, Object>> searchPage(String keyword, int pageNo, int pageSize) throws IOException {if (pageNo <= 1) {pageNo = 1;}//条件搜索SearchRequest searchRequest = new SearchRequest("jd_goods");SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();//分页sourceBuilder.from(pageNo);sourceBuilder.size(pageSize);//精准匹配关键字TermQueryBuilder termQueryBuilder = QueryBuilders.termQuery("title", keyword);sourceBuilder.query(termQueryBuilder);sourceBuilder.timeout(new TimeValue(60, TimeUnit.SECONDS));//高亮HighlightBuilder highlightBuilder = new HighlightBuilder();highlightBuilder.requireFieldMatch(false);//关闭多个高亮显示highlightBuilder.preTags("<span style='color:red'>");highlightBuilder.postTags("</span>");highlightBuilder.field("title");sourceBuilder.highlighter(highlightBuilder);//执行搜索searchRequest.source(sourceBuilder);SearchResponse searchResponse = client.search(searchRequest,       RequestOptions.DEFAULT);//解析结果ArrayList<Map<String, Object>> list = new ArrayList<>();for (SearchHit hit : searchResponse.getHits().getHits()) {//解析高亮字段 获取字段  将原来的字段换为我们高亮的字段Map<String, HighlightField> highlightFields = hit.getHighlightFields();HighlightField title = highlightFields.get("title");Map<String, Object> sourceAsMap = hit.getSourceAsMap();if (title != null) {Text[] fragments = title.fragments();String n_title = "";for (Text fragment : fragments) {n_title += fragment;}sourceAsMap.put("title",n_title);}list.add(hit.getSourceAsMap());}return list;}}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/7042.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RabbitMQ的确认机制

RabbitMQ的确认机制 生产者确认 public class ProductionMessageConfirm {public static void Send(){ConnectionFactory factory new ConnectionFactory();factory.HostName "localhost";//RabbitMQ服务在本地运行factory.UserName "guest";//用户名…

react实现页面动态表单设计器(自定义推拽表单)

react实现页面动态表单设计器&#xff08;自定义推拽表单&#xff09; 实现效果安装插件使用组件介绍基本设置&#xff0c;可设置控件标签&#xff0c;是否必填&#xff0c;校验规则校验规则有如下几种多选&#xff0c;下拉&#xff0c;单选可动态设置每个选择的label以及值 实…

一百三十三、Hive——Hive外部表加载含有JSON格式字段的CSV文件数据

一、目标 在Hive的ODS层建外部表&#xff0c;然后加载HDFS中的CSV文件数据 注意&#xff1a;CSV文件中含有未解析的JSON格式的字段数据&#xff0c;并且JSON字段中还有逗号 二、第一次建外部表&#xff0c;直接以&#xff0c;分隔行字段&#xff0c;结果JSON数据只显示一部分…

vue3相对路径图片编译后无法显示

<img src"../assets/image/ai_content_12x.png" /> 是这么写的&#xff0c;图片用的相对路径&#xff0c;在本地不编译的话是没有问题正常。 但是编译后你就会发现在域名后一旦有路径&#xff0c;整个vue的 img js css 的加载路径都会报错。 需要在vue.config.…

【1++的C++初阶】之list

&#x1f44d;作者主页&#xff1a;进击的1 &#x1f929; 专栏链接&#xff1a;【1的C初阶】 文章目录 一&#xff0c;什么是list二&#xff0c;构造与析构2.1 结点结构2.2 链表结构2.3 迭代器结构 三&#xff0c;部分重要接口的作用及其实现3.1 迭代器相关的接口3.2 list相关…

【微信小程序】实现折叠功能,折叠不同的列表

要实现微信小程序中的折叠功能&#xff0c;可以使用wx:if或hidden属性来控制列表的显示与隐藏。同时&#xff0c;可以使用icon组件来添加指示箭头。 首先&#xff0c;在wxml文件中创建两个List列表&#xff0c;使用一个变量来控制列表的显示与隐藏&#xff1a; <view>&…

【VCS】(5)Fast RTL-level Verification

Fast RTL-level Verification General Coding GuidlinesLab --- simprofile$display() 输出彩色内容 前面的内容都是在说怎样进行仿真和验证&#xff0c;即如何使用 VCS 。 但是&#xff0c;仿真和验证是不是也有所讲究&#xff1f; 有没有一些标准来衡量设计代码和验证代码的质…

62. 不同路径

题目链接&#xff1a;力扣 解法一&#xff1a;动态规划 定义状态&#xff1a;对于m*n的网络&#xff0c;从最后一行到右下角&#xff0c;以及从最后一列到右下角&#xff0c;都只有一条不同路径&#xff1a;一直向右或一直向下&#xff0c;所以可以定义状态&#xff1a;dp[i][…

OpenCV系列__chapter2

这里写目录标题 1 图像加减乘除位运算1.1 加法 img cv2.add(img1, img2)1.2 减法 img cv2.subtract(img1, img2)1.3 乘法 img cv2.multiply(img1, img2)1.4 除法 img cv2.divide(img1, img2)1.5 位运算 2 图像增强2.1 线性变换2.2 非线性变换 3 图像几何变换3.1 裁剪、放大…

Java设计模式之单例模式(Singleton)模式

单例模式&#xff08;Singleton&#xff09;确保一个类只有一个实例&#xff0c;且提供一个全局访问点。 什么是单例模式 单例模式是一种非常常用的设计模式&#xff0c;它可以确保一个类只有一个实例&#xff0c;并且提供一个全局访问点。在单例模式中&#xff0c;应用程序中…

java(springboot)对接elasticsearch8+

1、pom引用 注&#xff1a;jackson包es只用到了databind&#xff0c;之所以全部引用是因为actuator用到了其他&#xff0c;只升级一个会 导致版本冲突 <!-- https://mvnrepository.com/artifact/co.elastic.clients/elasticsearch-java --> <dependency><grou…

七大排序算法和计数排序

文章目录 一、直接插入排序二、希尔排序三、直接选择排序四、堆排序五、冒泡排序六、快速排序6.1递归实现快速排序6.2非递归实现快速排序 七、归并排序7.1递归实现归并排序7.2非递归实现归并排序 八、计数排序 以下排序以从小到大排序为例 一、直接插入排序 时间复杂度&#x…

文章审核之敏感词过滤

技术选型 DFA实现原理 DFA全称为&#xff1a;Deterministic Finite Automaton,即确定有穷自动机。 存储&#xff1a;一次性的把所有的敏感词存储到了多个map中&#xff0c;就是下图表示这种结构 敏感词&#xff1a;冰毒、大麻、大坏蛋 工具类 最下面的main方法是测试用的&a…

Java版本电子招标采购系统源代码—企业战略布局下的采购寻源

智慧寻源 多策略、多场景寻源&#xff0c;多种看板让寻源过程全程可监控&#xff0c;根据不同采购场景&#xff0c;采取不同寻源策略&#xff0c; 实现采购寻源线上化管控&#xff1b;同时支持公域和私域寻源。 询价比价 全程线上询比价&#xff0c;信息公开透明&#xff0c;可…

微信小程序-地图上的图标计算旋转值朝向经纬度计算

废话不多说&#xff0c;开整 // 参数为寄件人经纬度和收件人经纬度 // 根据寄收件人经纬度弧度π进行rotate旋转计算 const getRotate (po1, po2) > {if (!(po1 && po2)) return 0const lng_a po1.longitudeconst lat_a po1.latitudeconst lng_b po2.longitud…

MySQL使用

目录 1 MySQL的登录 1.1 服务的启动和终止 1.2 自带客户端的登录与退出 2 MySQL演示使用 2.1 MySQL的使用演示 2.2 MySQL的编码设置 1 MySQL的登录 1.1 服务的启动和终止 MySQL安装完毕以后&#xff0c;需要启动服务器进程&#xff0c;不然客户端无法连接数据库。 在前面…

vue-cli项目中,使用webpack-bundle-analyzer进行模块分析,查看各个模块的体积,方便后期代码优化

一、安装 npm install --save-dev webpack-bundle-analyzer 二、在vue.config.js中配置 const BundleAnalyzerPlugin require(webpack-bundle-analyzer).BundleAnalyzerPlugin plugins: [new BundleAnalyzerPlugin({analyzerMode: server,analyzerHost: 127.0.0.1,analyze…

Word2Vec实现文本识别分类

深度学习训练营之使用Word2Vec实现文本识别分类 原文链接环境介绍前言前置工作设置GPU数据查看构建数据迭代器 Word2Vec的调用生成数据批次和迭代器模型训练初始化拆分数据集并进行训练 预测 原文链接 &#x1f368; 本文为&#x1f517;365天深度学习训练营 中的学习记录博客&…

探析国内数字孪生引擎技术现状

在数字孪生软件来发中&#xff0c;渲染引擎是一个关键点&#xff0c;国内大多数字孪生平台引擎通常使用的是自研的渲染引擎或者采用开源的渲染引擎。下面通过一些常见的渲染引擎在国内数字孪生引擎中的应用带大家了解数字孪生软件开发的方式。 自研渲染引擎&#xff1a;许多数…

HTTPS安全套接字层超文本传输协议

HTTPS安全套接字层超文本传输协议 HTTPS简介HTTPS和HTTP的主要区别客户端在使用HTTPS方式与Web服务器通信时的步骤SSL/TLS协议的加密&#xff08;握手&#xff09;过程为什么数据传输阶段使用对称加密HTTPS 的优点HTTPS 的缺点HTTPS 的优化证书优化会话复用 HTTPS简介 HTTP协议…