如何优化 Elasticsearch 磁盘空间和使用情况

作者:来自 Elastic Kofi Bartlett

解释如何防止和处理磁盘过满(过度使用)以及磁盘容量未被充分利用的情况。

想获得 Elastic 认证?了解下一次 Elasticsearch Engineer 培训的时间吧!

Elasticsearch 拥有许多新功能,帮助你为自己的使用场景构建最佳搜索解决方案。浏览我们的示例笔记本了解更多内容,开始免费云端试用,或立即在本地机器上尝试 Elastic。


磁盘管理在任何数据库中都非常重要,Elasticsearch 也不例外。如果你没有足够的磁盘空间,Elasticsearch 将停止向该节点分配分片。这最终会导致你无法向集群写入数据,应用程序可能因此面临数据丢失的风险。另一方面,如果你有太多磁盘空间,那么你就为不需要的资源付出了额外成本。

关于水位线的背景 - watermarks

在你的 Elasticsearch 集群中有各种 “水位线 ”阈值,用于帮助你跟踪可用磁盘空间。随着节点上的磁盘逐渐填满,第一个被触发的阈值是 “low disk watermark - 低磁盘水位线”。第二个阈值是“high disk watermark threshold - 高磁盘水位线阈值”。最后,会达到 “disk flood stage - 磁盘洪水阶段”。一旦超过这个阈值,集群将阻止写入所有在该节点上有一个分片(主分片或副本分片)的索引。读取(搜索)仍然是可行的。

如何防止和处理磁盘过满(过度使用)的情况

当你的 Elasticsearch 磁盘过满时,有多种方法可以处理:

  1. 删除旧数据:通常,数据不应永久保存。防止和解决磁盘过满的一种方法是确保当数据达到一定年龄时,被可靠地归档并删除。可以使用 ILM 来实现这一点。
  2. 增加存储容量:如果你不能删除数据,可能需要添加更多数据节点或增加磁盘容量,以便保留所有数据而不影响性能。如果你需要为集群增加存储容量,应该考虑是否只需要增加存储容量,还是也需要按比例增加 RAM 和 CPU 资源(见下面关于磁盘大小、RAM 和 CPU 比例的部分)。

如何为你的 Elasticsearch 集群增加存储容量

  1. 增加数据节点数量:请记住,新节点应与现有节点大小相同,并使用相同的 Elasticsearch 版本。
  2. 增加现有节点的大小:在基于云的环境中,通常可以轻松增加现有节点的磁盘大小和 RAM/CPU。
  3. 仅增加磁盘大小:在基于云的环境中,通常可以相对轻松地增加磁盘容量。
  4. 快照与还原:如果你愿意通过自动化流程从备份中按需检索旧数据,你可以对旧索引进行快照、删除它们,并在需要时从快照中临时还原数据。
  5. 减少每个分片的副本数:另一种减少数据的方式是减少每个分片的副本数量。为了实现高可用性,通常每个分片会有一个副本,但当数据变旧时,你可能可以在没有副本的情况下运行。这通常适用于数据是持久性的,或你有备份可以在需要时还原。
  6. 创建告警:为了防止未来磁盘被填满并主动采取行动,你应该根据磁盘使用情况创建告警,当磁盘开始填满时会通知你。

如何防止和处理磁盘容量未被充分利用的情况

如果你的磁盘容量未被充分利用,有多种方法可以减少集群中的存储体积。

如何减少 Elasticsearch 集群的存储体积

以下是几种减少集群存储体积的方法:

1 . 减少数据节点数量

如果你希望同时减少数据存储以及 RAM 和 CPU 资源,这是一种最简单的策略。下线不必要的节点通常可以带来最大的成本节省。

在下线节点之前,你应当:

  • 确保要下线的节点不是必须的 MASTER 节点。你应始终至少保留三个拥有 MASTER 角色的节点。
  • 将数据分片从要下线的节点迁移出去。

2. 用更小的节点替换现有节点

如果你不能进一步减少节点数量(通常最小配置为 3 个节点),那么你可以考虑缩小现有节点的规格。请记住,建议所有数据节点的 RAM 和磁盘大小相同,因为分片是根据每个节点上的分片数量来平衡的。

操作流程如下:

  • 向集群添加新的、更小的节点
  • 将分片从要下线的节点迁移出去
  • 关闭旧节点

3. 减少节点的磁盘大小

如果你只想减少节点上的磁盘大小,而不改变整个集群的 RAM 或 CPU,那么你可以为每个节点减少磁盘容量。减少 Elasticsearch 节点的磁盘大小并不是一个简单的过程。

最简单的方法通常是:

  • 从节点上迁移分片
  • 停止该节点
  • 为节点挂载一个合适大小的新数据卷
  • 将所有数据从旧磁盘卷复制到新卷
  • 卸载旧卷 A
  • 启动节点并将分片迁移回该节点

这个过程要求其他节点有足够容量来临时存放该节点的分片。在很多情况下,管理这个过程的成本可能会超过节省的磁盘开销。因此,直接用一个具有目标磁盘大小的新节点替换原节点可能更简单(参见上文 “用更小的节点替换现有节点”)。

当你为不必要的资源付费时,显然可以通过优化资源使用来降低成本。

磁盘大小、RAM 和 CPU 之间的关系

集群中磁盘容量与 RAM 的理想比例取决于你具体的使用场景。因此,在考虑更改存储容量时,你也应该评估当前的磁盘/RAM/CPU 比例是否平衡,以及是否需要按比例增加或减少 RAM/CPU。

RAM 和 CPU 的需求取决于索引活动的数量、查询的数量和类型,以及被搜索和聚合的数据量。这些通常与存储在集群中的数据量成正比,因此也应与磁盘大小相关。

磁盘容量与 RAM 之间的比例会根据使用场景的不同而变化。以下是一些示例:

Index activityRetentionSearch activityDisk capacityRAM
Enterprise search appModerate log ingestionLongLight2TB32GB
App monitoringIntensive log ingestionShortLight1TB32GB
E-commerceLight data indexingIndefiniteHeavy500GB32GB

请记住,修改节点机器的配置必须小心进行,因为这可能涉及节点停机,你需要确保分片不会开始迁移到其他已经超负荷的节点上。

原文:How to optimize Elasticsearch disk space and usage - Elasticsearch Labs

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/906236.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

itop-3568开发板驱动开发指南-实验程序的编写

本实验对应的网盘路径为:iTOP-RK3568 开发板【底板 V1.7 版本】\03_【iTOP-RK3568开发板】指南教程\02_Linux 驱动配套资料\04_Linux 驱动例程\02。 本章实验将编写 Linux 下的驱动传参实例代码,通过“insmod”命令进行参数的传递,并将相应的…

lesson03-简单回归案例(理论+代码)

一、梯度下降 二、 线性方程怎么样? 三、有噪音吗? 四、让我们看一个列子 五、如何优化 启发式搜索 学习进度 六、线性回归、逻辑回归、分类 总结、 简单线性回归是一种统计方法,用于确定两个变量之间的关系。具体来说,它试图…

【C语言】易错题 经典题型

出错原因&#xff1a;之前运行起来的可执行程序没有关闭 关闭即可 平均数&#xff08;average&#xff09; 输入3个整数&#xff0c;输出它们的平均值&#xff0c;保留3位小数。 #include <stdio.h> int main() {int a, b, c;scanf("%d %d %d", &a, &…

修改样式还能影响功能?是的!

最常见的几种样式导致按钮点击无效的情况&#xff1a; 1. pointer-events: none; &#x1f449; 点击被彻底屏蔽 症状&#xff1a;按钮完全不能点击&#xff0c;事件不会触发。 可能原因&#xff1a;这个样式让元素“无法响应鼠标事件”。 button {pointer-events: none; }…

ai决策平台:AnKo如何推动引领智能化未来?

ai决策平台&#xff1a;AnKo如何推动引领智能化未来&#xff1f; ai决策平台正在改变企业运营模式&#xff0c;AnKo作为ai决策平台的代表&#xff0c;为智能管理提供新方向。借助ai决策平台&#xff0c;组织在效率与准确性上实现飞跃。ai决策平台的力量正被广泛认可。 ai决策…

开疆智能Profient转ModbusTCP网关连接ABB机器人MODBUS TCP通讯案例

本案例是通过开疆智能Profinet转ModbusTCP网关将西门子PLC与ABB机器人进行通讯 因西门子PLC采用Profinet协议&#xff0c;而ABB机器人采用的是ModbusTCP通讯。故采取此种方案。 配置过程&#xff1a; 1.MODBUS/TCP基于以太网&#xff0c;故ABB机器人在使用时需要有616-1PCIN…

2089. 找出数组排序后的目标下标——O(n)做法!

本题要求在一个已排序的数组 nums 中&#xff0c;找出所有等于目标值 target 的元素下标。若不存在这样的元素&#xff0c;则返回 {-1, -1}。解决该问题有两种主要方法&#xff1a;二分查找法和统计计数法。 二分查找法&#xff1a;首先对数组进行排序&#xff0c;然后通过二分…

pyspark测试样例

from pyspark.sql import SparkSession from pyspark.sql.functions import col, lit, concat 创建 SparkSession spark SparkSession.builder.appName(“SparkSQLExample”).getOrCreate() 创建 DataFrame&#xff08;可以是从 CSV、JSON 等文件读取&#xff09; data […

【AWS入门】AWS身份验证和访问管理(IAM)

【AWS入门】AWS身份验证和访问管理&#xff08;IAM&#xff09; [AWS Essentials] AWS Identity and Access Management (IAM) By JacksonML 众所周知&#xff0c;AWS亚马逊云科技位列全球云计算服务第一位&#xff0c;并且持续为广大客户提供安全、稳定的各类云产品和服务。…

HarmonyOS NEXT 适配高德地图FlutterSDK实现地图展示,添加覆盖物和移动Camera

HarmonyOS NEXT 适配高德地图 Flutter SDK 实现地图展示&#xff0c;添加覆盖物和移动 Camera 在现代移动应用开发中&#xff0c;地图功能是许多应用的核心组成部分之一。HarmonyOS NEXT 提供了强大的跨平台开发能力&#xff0c;而高德地图 Flutter SDK 则为开发者提供了丰富的…

三键标准、多键usb鼠标数据格式

三键标准usb鼠标数据格式 滚轮上滚 滚轮下滚 鼠标快速上移 鼠标快速右移 鼠标快速左移 鼠标右键单击_抬起 鼠标中键单击_抬起 鼠标左键单击_抬起 鼠标左键先按_右键再按_同时抬起 鼠标左右键同时按下_同时抬起 鼠标左右键同时按下_右键先抬 多键usb鼠标…

软件架构风格系列(7):闭环控制架构

文章目录 引言一、闭环控制架构&#xff1a;让系统学会“自我调节”的魔法&#xff08;一&#xff09;从温控系统理解核心原理&#xff08;二&#xff09;核心组件解析 二、架构设计图&#xff1a;闭环控制的“四大核心环节”三、Java实战&#xff1a;手写一个智能温控系统&…

Python中的组合数据类型

一、列表类型 列表是指一系列的按特定顺序排列的元素组成。使用[]定义列表&#xff0c;元素与元素之间使用英文的逗号分隔&#xff0c;列表中的元素可以是任意的数据类型。 #直接使用[]创建 lst[hello,world,99.8,100] print(lst)#可以使用内置的list()函数创建列表 lst2list(h…

集合进阶2

Java不可变集合、Stream流与方法引用深度解析 一、不可变集合&#xff08;Immutable Collections&#xff09;进阶指南 1.1 不可变集合核心特性 防御性编程&#xff1a;防止外部修改数据&#xff08;如传递集合给第三方库时&#xff09;线程安全&#xff1a;天然支持多线程读…

MySQL企业版免费开启,强先体验

近期Oracle突然宣布&#xff0c;MySQL企业版面向开发者免费开放下载&#xff0c;这一消息瞬间引爆DBA圈。作为数据库领域的“顶配车型”&#xff0c;企业版长期因高昂授权费让中小团队望而却步&#xff0c;如今免费开放无异于“劳斯莱斯开进菜市场”。 本文将深度拆解企业版的…

数据要素及征信公司数据要素实践

数据要素及征信公司数据要素实践 1.数据要素的定义与核心特征2.征信公司应用数据要素的实践路径3.总结1.数据要素的定义与核心特征 数据要素是数字经济时代的新型生产要素,指以电子形式存在、通过计算方式参与生产经营活动并创造价值的数据资源。 其核心特征包括: 新型生产…

Golang 范型

引言 Go 从 1.18 开始正式支持泛型&#xff0c;带来了更强的类型抽象能力&#xff0c;使得我们可以编写更通用、可复用的代码。本文档将介绍下泛型与应用的一些内容 什么是泛型 泛型&#xff08;Generic&#xff09;是一种允许你编写“参数化类型”的编程方式。你可以将类型…

vue-ganttastic甘特图label标签横向滚动固定方法

这个甘特图之前插件里&#xff0c;没有找到能固定label标签在屏幕上的办法&#xff0c;用css各种办法都没有实现&#xff0c;所以我我直接手写定位&#xff0c;用js监听滚动条滚动的距离&#xff0c;然后同步移动甘特图label标签&#xff0c;造成一种定位的错觉&#xff0c;以下…

VS2017编译openssl3.0.8

openssl是一个功能丰富且自包含的开源安全工具箱。它提供的主要功能有:SSL协议实现(包括SSLv2、SSLv3和TLSv1)、大量软算法(对称/非对称/摘要)、大数运算、非对称算法密钥生成、ASN.1编解码库、证书请求(PKCS10)编解码、数字证书编解码、CRL编解码、OCSP协议、数字证书验证、P…

16【架构进阶】Flask蓝图与应用工厂模式:构建企业级Web应用的核心技巧

【架构进阶】Flask蓝图与应用工厂模式&#xff1a;构建企业级Web应用的核心技巧 前言&#xff1a;为什么应用架构决定项目的天花板&#xff1f; 在Flask开发中&#xff0c;随着项目规模的扩大&#xff0c;如何组织代码结构成为决定项目可维护性和扩展性的关键因素。单文件应用…