【云上ELK系列】Logstash迁移Elasticsearch数据方法解读

摘要: 用Logstash实现Elasticsearch集群快速迁移,解读Logstash中metadata的功效,避免踩坑

Elasticsearch中数据搬迁是工程师们经常会做的,有时是为了集群迁移、有时是为了数据备份、有时是为了升级等等,迁移的方式也有很多种,比如说通过elasticsearch-dump、通过snapshot、甚至是通过reindex的方式来做。今天为大家介绍另一种方案:用Logstash实现Elasticsearch集群快速迁移

我们希望通过logstash来做数据迁移本身的原理很容易理解,通过logstash从源elasticsearch Cluster读数据,写入到目标elasticsearh
Cluster中,详细操作如下:

在logstash的目录下创建一个logstash的用于数据同步的conf文件

vim ./logstash-5.5.3/es-es.conf

配置conf文件,由于我们只需要做index搬迁,所以目标Cluster和源Cluster的index命名相同即可。

input {elasticsearch {hosts => ["********your host**********"]user => "*******"password => "*********"index => "logstash-2017.11.07"size => 1000scroll => "1m"}
}
# 该部分被注释,表示filter是可选的
filter {
}
output {elasticsearch {hosts => ["***********your host**************"]user => "********"password => "**********"index => "logstash-2017.11.07"}
}

conf文件配置完成后执行logstash

bin/logstash -f es-es.conf

执行这句指令时,有时会遇到如下的报错信息

[FATAL][logstash.runner] Logstash could not be started because there is already another instance using the configured data directory.  If you wish to run multiple instances, you must change the "path.data" setting.

这是因为当前的logstash版本不支持多个instance共享一个path.data,所以需要在启动时,命令行里增加”–path.data PATH “,为不同实例指定不同的路径

bin/logstash -f es-es.conf --path.data ./logs/

如果执行顺利,执行下面这个命令就可以在目标的elasticsearch中看到对应的index

curl -u username:password host:port/_cat/indices

以上介绍了如何通过logstash来迁移elasticsearch中指定的index,下面介绍一个实用的场景:

**很多自建了Elasticsearch客户最近都会关注到阿里云Elasticsearch这款产品。想要使用时却遇到了一个如何把自建中的数据迁移到阿里云Elasticsearch的困惑。下面介绍一下如何通过logstash快速的搬迁云上自建的Elasticsearch中的index数据。
**

这个方案的逻辑很简单,拆解开就是配置N个es-to-es的conf文件,但这样做很繁琐。其实logstash提供了批量做这件事情的能力,为此需要提前介绍三个重要概念:

metadata:logstash 1.5版本之后,使用了metadata的概念,来描述一次event,并且允许被用户修改,但是不会写到event的结果中,对event的结果产生影响。除此之外,metadata将作为event的元数据描述信息,可以在input、filter、output三种插件的全执行周期内存活;
参考文档《Make Your Config Cleaner and your Log Processing Faster with Logstash Metadata》

docinfo:elasticsearch input插件中的一个参数,默认是false,官网上描述的原文是“If set, include Elasticsearch document information such as index, type, and the id in the event.”也就意味着设置了这个字段生效,会将index、type、id等信息全部记录到event中去,也就是metadata中去,这也就意味着可以在整个event执行周期内,使用者可以随意的使用index、type、id这些参数了;
elasticsearch input插件中的index参数,支持通配符,可以用“*”这样的模糊匹配通配符来表示所有对象;
由于metadata的特性,我们可以在output中直接“继承”input中的index、type信息,并在目标Cluster中直接创建和源Cluster一摸一样的index和type,甚至是id。

在整个过程中如果希望可以看到metadata信息,并且对其进行类debug的操作,需要在output中添加一个配置:

stdout { codec => rubydebug { metadata => true } }

示例配置代码如下:

input {elasticsearch {hosts => ["yourhost"]user => "**********"password => "*********"index => "*"#该通配符代表需要读取所有index信息size => 1000scroll => "1m"codec => "json"docinfo => true}
}
# 该部分被注释,表示filter是可选的
filter {
}output {elasticsearch {hosts => ["yourhost"]user => "********"password => "********"index => "%{[@metadata][_index]}"}stdout { codec => rubydebug { metadata => true } }}

执行后,logstash会将源Cluster中所有的index全部copy到目标Cluster中去,并将mapping信息携带过去,随后开始逐步做index内的数据迁移。

建议:正式执行的时候

stdout { codec => rubydebug { metadata => true } }

这个配置项建议去掉,否则会被满屏的刷metadata信息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/523178.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深圳市南山区学计算机的视频课程,新手学电脑全套视频教程(1-27集)

视频介绍这次推荐的这部新手学电脑视频教程是一部不可多得的实用教程,详细介绍了新手学习电脑需要掌握的基础知识和基本操作。它首先让大家学习和了解了电脑的基础知识、Windows Vista操作系统、鼠标和键盘的使用,以及汉字的输入方法,在此基础…

idea解决maven pom依赖下载失败

流程1 第一步:打开cmd窗口,进入repository本地仓库 执行命令: 进入本地仓库: cd %userprofile%\.m2\repository第二步:执行以下命令: for /r %i in (*.lastUpdated) do del %i流程2 mvn -U idea:idea

6位技术大咖11月倾心巨献,大数据+安全主题的技术分享合集【阿里云MVP 干货集锦】...

摘要: 大家好,阿里云 MVP 11月大数据安全主题分享新鲜出炉,快来一睹为快吧!哪些MVP的分享最吸引你,你最想支持哪个MVP? 我们将开启为期一周的最人气内容评选,我们将在MVP评论内容下抽取评论最佳…

淤泥管道机器人_丛台区设备管道清洗超高效率

丛台区设备管道清洗超高效率后,施工前对施工人员安全措施安排完毕后,对检查井内剩余的砖、石、部分淤泥等残留物进行人工清理,直到清理完毕为止。  CCTV管道检测是指管道闭路电视检测系统可以实现排水管道的内窥检测工作:可以检…

华为发布开发者召集令,等你来战!

戳蓝字“CSDN云计算”关注我们哦!曾几何时,“上云”只是大型企业和科技领域的特权。时至今日,“云”不再是漂浮空中那般缥缈。普通企业,甚至是个人开发者之间,对“上云”的谈及也如同一日三餐那么平常。对于新兴行业而…

承担集团数万应用、研发人员日常工作,阿里持续交付平台的设计、迭代之道...

摘要: 阿里持续交付平台已经经历了 8 年的不断迭代进化,成长为集团几万应用所依赖的最重要的研发工具,它的效率直接影响着几万研发日常工作。但平台不能只是工具的堆砌,更需要针对互联网时代的研发模式进行深度思考,不…

计算机网络按照延伸距离划分为,大学计算机考试练习题.doc

大学计算机考试练习题网络基础知识单选题1.下面不属于局域网络硬件组成的是___。A. 网络服务器 B. 个人计算机工作站? C. 网络接口卡 D. 调制解调器2.局域网由____ ____统一指挥,提供文件、打印、通信和数据库等服务功能。A. 网卡 B. 磁盘操…

使用FTP下载文件connect.retrieveFileStream(filename) 获取不到InputStream流,返回null的问题

使用同事的代码做FTP下载文件,InputStream in connect.retrieveFileStream(fileName);执行这句时InputStream总是获取为空 后来把代码改成ftp.retrieveFileStream(new String(dirPath[1].getBytes(“UTF-8”), “ISO-8859-1”));加上字符集指定就好了,…

css怎么让两个table并排_关于CSS布局

水平居中水平居中可能是CSS布局中最常用到的布局,这里介绍几种水平居中的方式1、使用inline-block 和 text-align实现.parent{text-align: center;} .child{display: inline-block;}优点:兼容性好;不足:需要同时设置子元素和父元素…

边缘计算高考题!全答对就可以去华为上班!

戳蓝字“CSDN云计算”关注我们哦!作者 | 边小缘来源 | 边缘计算社区绝密★启用前2019年普通高等学校招生全国统一考试(边缘计算社区版)不定向选择题。(1010100分)1以下哪项不是边缘计算的特点?A.低时延C.离…

《2017中国开发者调查报告》即将发布!你看那个人,好像一个程序员哦!

摘要: 2017云栖大会北京峰会期间,云栖社区即将重磅发布首份《2017中国开发者调查报告》,历时3个月的调研,7032人参与调查问卷,最终呈现出一份集开发者画像与能力的完整描绘。想了解最接地气的中国开发者现状吗&#xf…

中蜂几月份自然分蜂_蜜蜂的种类:北黑蜂,中华蜜蜂,皖南中蜂,贵州纳雍中蜂等等...

北黑蜂东北黑蜂是在闭锁优越的自然环境里通过自然选择与人工进行所培育的中国唯一的地方优良蜂种,分布在我国黑龙江省饶河县,其各项生理指标均明显优于世界四大著名蜂种,这是其它蜂种不可比拟的,也是我国乃至世界不可多得的极其宝…

html邮件和纯文本邮件区别,邮件营销必读系列五--纯文本和HTML邮件类型——哪一种邮件类型更适合你?...

仍然会除去你的代码中的很多所谓的“冗余元素”,所以,如果不符合邮件服务商的反垃圾邮件要求,无论你的邮件设计人员投入了多少时间,花费了多少精力,邮件设计得有多精美,最后收件人看到的可能就只是白纸黑字…

2017,人工智能技术如何让中国开发者“倾心”又“上火”!

摘要:2017云栖大会北京峰会期间,云栖社区即将重磅发布首份《2017中国开发者调查报告》,历时3个月的调研,7032人参与调查问卷,最终呈现出一份集开发者画像与能力的完整描绘。本文就让大家先睹为快,分享其中关…

OpenStack入门科普,看这一篇就够啦!

戳蓝字“CSDN云计算”关注我们哦!作者 | 小枣君来源 | 鲜枣课堂大家好,我是小枣君。最近几年,OpenStack这个词开始频繁出现,引起了越来越多人的关注。对于大部分人来说,这是一个很陌生的词,不知道它到底是什…

代码谱写传奇,深度揭秘中国开发者现状!

摘要:云栖社区重磅发布首份《2017中国开发者调查报告》,历时3个月的调研,7032人参与调查问卷,最终呈现出一份集开发者画像与能力的完整描绘。《报告》总结概括了中国八大开发技术领域特征,涵盖了Web开发、前端开发、云…

linux还原系统_怎么成为一名合格的Linux运维工程师

随着云时代的到来,企业对运维工程师提出了新的要求。以某银行Linux运维工程师招聘为例,应聘者不仅要熟悉Linux、Windows等操作系统运维,掌握Oracle数据库、Weblogic中间件技术及网络技术;还要具有ITSM运维体系事件流程、变更流程、服务台管理…

国家开放大学计算机应用模块3客观题答案,国家开放大学《计算机应用基础》考试与答案形考任务模块3模块3Excel2010电子表格系统—客观题答案.pdf...

Excel 2010 上机操作题(共 5 题,4 分/ 题)1. 创建如下工作表,并保存为 EXLT1.xlsx 文件。接着完成以下操作:(1)用填充柄自动填充“值日时间”,从“星期六”开始,按顺序向下填充;(2 )将列的次序取反&#xf…

ERP物理机迁移至阿里云实践

摘要: ERP物理机迁移至阿里云实践 机房选型 随着公司的不断发展,业务量逐渐增大,对信息化的要求也越来越高,随之对信息部的要求也越来越多,为此公司决定对现有的信息系统进行升级改造. ERP物理机迁移至阿里云实践 一、机房选型 随着公司的不断发展,业务量逐渐增大,…

Sublime Text设置快捷键让html文件在浏览器打开

一、安装View In Browser插件 快捷键 CtrlShiftP(菜单栏Tools->Command Paletter),输入 pcip选中Install Package并回车,输入View In Browser的插件回车就安装了 设置快捷键 菜单栏Preferences->Key Bindings-User&#…