Kafka Connect在MapR上

在本周的白板演练中,MapR的高级产品营销经理Ankur Desai描述了Apache Kafka Connect和REST API如何简化和提高在处理来自包括旧数据库或数据仓库在内的各种数据源的流数据时的敏捷性。 他还解释了使用MapR Streams与Kafka进行数据传输时此体系结构的差异。

其他资源:

  • 卡罗尔·麦克唐纳(Carol MacDonald)的“使用Spark机器学习,流和Kafka API监视实时Uber数据”博客教程
  • Tugdual Grall撰写的使用Kafka API的示例程序的“ MapR Streams入门”博客教程。
  • Apache Flink简介: Ellen Friedman和Kostas Tzoumas撰写的《 实时和超越流处理》一书在线免费阅读

这是完整的视频转录:

嗨,我是Ankur Desai。 我在MapR的产品团队中工作。 欢迎来到我的白板演练。 今天,我将讨论流式架构以及该架构的新进展如何帮助使该架构更加敏捷和简单。 让我们谈谈这一切如何运作。

这是典型的流架构。 在左侧,您具有诸如社交媒体,传感器和各种数据之类的数据源。 然后,您将使用Flume之类的数据收集器从这些数据源获取数据,然后Flume充当Kafka的生产者。 另外,请记住您也有旧式数据源,例如数据库和数据仓库。 要从这些来源获取数据并放入Kafka中,通常可以使用充当Kafka生产者的自定义代码,也可以再次使用数据收集器。

数据放入Kafka后,Kafka将充当流式体系结构的消息传递系统。 它充当传输层。 将数据保存在Kafka中之后,Kafka便可以将数据提供给流处理引擎,例如Spark Streaming和Flink。 流处理层用于ATL,分析和聚合之类的目的。 处理完成后,您希望将结果存储在持久层中,以使其可用于下游应用程序。

让我们谈谈如何使整个体系结构更敏捷,更简单。 让我们从REST API开始。 REST API,让我在这里画一下进行解释。 REST API允许在任何环境中的任何编程语言使用SJDP将数据写入Kafka。 同时,请记住,我们也有经常需要与Kafka对话的旧数据源。 该社区已经开发了一个工具集,即称为Kafka Connect的框架。 Kafka Connect是一组预先建立的连接器,可以帮助您将数据从旧系统导入Kafka。 现在,您可以使用Kafka Connect在Kafka中进出数据。 结果,整个架构更加简单。

Kafka Connect提供了预构建的连接器,因此您不必每次都要在旧系统中进出数据时都编写自定义代码。 另外,Kafka Connect不仅可以用作数据导入工具,还可以将数据从Kafka导出到某些目标。 此外,让我们谈谈如何将这种体系结构的某些组件融合到一个平台,一个集群,一个系统中。

借助MapR融合数据平台,我们用MapR Streams替换了Kafka,而后者使用了相同的API。 您所有的Kafka应用程序也将在MapR上运行。 MapR融合数据平台将传输处理和持久性的所有必需组件融合到一个集群,一个系统中的一个平台上。 您在此红色方框内看到的所有内容实际上都在同一集群中的同一平台上运行。 所有这些都在MapR上融合。 这实际上有助于消除不同群集之间的数据移动。 结果,我们扩展了敏捷性和简单性的概念,因为现在您不必在不同集群之间移动数据。 这减少了等待时间,并引入了以前没有的架构简化。

在这里,您可以使用MapR融合数据平台使体系结构更简单,更灵活。 谢谢收看 如有任何疑问,请随时在下面写下评论。

翻译自: https://www.javacodegeeks.com/2016/12/kafka-connect-mapr.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/351809.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode--palindrome-number回文数

1、问题 Determine whether an integer is a palindrome. Do this without extra space. click to show spoilers. Some hints: Could negative integers be palindromes? (ie, -1) If you are thinking of converting the integer to string, note the restriction of u…

如何取消 登录_LSAT | 退考、缺考、取消成绩,各自的区别和流程是怎样的?

专注顶尖法学院JD/LLM申请指导咨询,更多内容请关注联才微信公众号:wisdom-linked排版 | 联才; 编辑 | 联才掐指一算,现在距离6/23亚洲场LSAT考试只剩下15天的时间了,你目前的备考进展如何呢?如果你拿不准是否要去考试&…

gtest 编译、安装和使用

本例以 gtest-1.7.0 为例进行讲解。一、要求:1. 安装 cmake二、编译1. 下载 gtest 源码包,并解压,如:/home/hdc/gtest-1.7.0; 2. 编译 gtest 动态库,进入 gtest-1.7.0 目录,编辑 CMakeLists.tx…

ReentrantReadWriteLock读写锁的使用

类ReentrantLock具有完全互斥排他的效果,即同一时间只有一个线程在执行ReentrantLock.lock()后面的代码。这样虽然保证了线程的安全性,但是效率低下。JDK提供了ReentrantReadWriteLock读写锁,使用它可以加快效率,在某些不需要操作…

idea如何把包变为模块_让我们将包变成模块系统!

idea如何把包变为模块使用构建系统将许多项目分为模块/子项目( Maven , Gradle , SBT …); 编写模块化代码通常是一件好事。 将代码分为构建模块主要用于: 隔离代码部分(减少耦合) …

VS2017无法启动

新安装了VS2017,安装没问题,但是总出现启动时没反应的状况,鼠标双击后转圈,然后就没然后了。。 解决办法: 第一步: 开始-->所有程序-->Microsoft Visual Studio 2017文件夹-->VisualStudio Tool…

gm怎么刷东西 rust_Rust语言:解引用详述,搞不明白这个概念,趁早放弃Rust

Rust是内存安全的,对新手来说,最大的困难是可恶的编译器,在其他语言上面叱咤风云,偏偏被Rust搞到崩溃。所以,大家都戏谑道,Rust是面向编译器编程。和编译器做斗争的过程中,遇到最多的是&#xf…

VS2010中使用gtest简单案例

1、下载googletest代码 https://github.com/google/googletest 2、解压并进入找到msvc文件夹 googletest-master\googletest-master\googletest\msvc 3、打开gtest.sln文件 4、编译gtest和gtest_main工程,生成gtestd.lib和gtest_maind.lib,将这两个静…

记录一次Oracle注入绕waf

这个注入挺特殊的,是ip头注入。我们进行简单的探测: 首先正常发起一次请求,我们发现content-type是76 探测注入我习惯性的一个单引号: 一个单引号我发现长度还是76 我开始尝试单引号,双引号一起: 我失败了长度还是76 一般sql注入输入单引号一…

生成字节码

在这篇文章中,我们将看到如何为我们的语言生成字节码。 到目前为止,我们已经看到了如何构建一种语言来表达我们想要的东西,如何验证该语言,如何为该语言构建编辑器,但实际上我们仍然无法运行代码。 是时候解决这个问题…

Java迭代器contains的问题

功能:ArrayList去除集合中字符串的重复值(字符串的内容相同),思路:创建新集合方式。 第一种编译运行没问题,第二种写法出错,原因是不可以两次使用it.next()。 错误提示:Exception in thread "main&q…

ad如何镜像器件_使用 Dockerfile 制作镜像

前面几篇文章已经给大家介绍了 Docker 的基本概念,相信大家也会使用 Docker 运行自己想要的容器了。但是只有学会制作镜像,才能将 Docker 应用到我们的项目中去。下面我们就来学习如何使用 Dockerfile 来制作镜像。Dockerfile 是一个文本文件&#xff0c…

centos7.5部署ELk

第1章 环境规划 1.1 ELK介绍 ELK是ElasticSerach、Logstash、Kibana三款产品名称的首字母集合,用于日志的搜集和搜索。 Elasticsearch:是一个开源分布式搜索引擎,提供搜集、分析、存储三大功能,特点是分布式、零配置、自动发…

使用Google Test的一个简单例子

0. 引子 本例是从 gtest-1.5.0 自带的 sample 中的 sample1 改写而来&#xff0c;笔者只添加了一个求 n 的阶层的函数&#xff0c;如下。 void Factorial(int n, int & result ) { result 1; for (int i 1; i < n; i) result * i; } 目的是想测试像这样将返回值放在参…

Java静态方法与非静态方法的泛型

Java中&#xff0c;非静态方法可以使用类的泛型&#xff0c;也可以定义自己的泛型&#xff1b;静态方法由于随着类的加载而加载&#xff0c;不能访问类的泛型&#xff08;因为在创建对象的时候才确定&#xff09;&#xff0c;因此必须定义自己的泛型类型。 详细请参考&#xf…

Android Studio 日志工具

在项目中提供5个方法打印日志 Log.v() 最常见的日志信息 Log.d() 调试信息 Log.i() 用于打印用户操作行为 Log.w()警告潜在风险 Log.e()报错信息 TAG 填入类名就好 msg:要打印的信息 也可以对信息进行过滤 点他弹出自定义的日志过滤器 转载于:https://www.cnblogs.com/feizianq…

jpa加密_使用JPA侦听器的数据库加密

jpa加密最近&#xff0c;我不得不将数据库加密添加到一些字段中&#xff0c;并且发现了很多不好的建议。 建筑问题 最大的问题是建筑。 如果持久性管理器静静地处理您的加密&#xff0c;那么根据定义&#xff0c;您的体系结构将在持久性和安全性设计之间要求紧密而不必要的绑…

同一进程中的线程究竟共享哪些资源

线程共享的环境包括&#xff1a;进程代码段、进程的公有数据(利用这些共享的数据&#xff0c;线程很容易的实现相互之间的通讯)、进程打开的文件描述符、信号的处理器、进程的当前目录和进程用户ID与进程组ID。 进程拥有这许多共性的同时&#xff0c;还拥有自己的个性。有了这些…

物联lot是什么意思_什么是物联网,物联网(lOT)简介

什么是物联网物联网(The Internet of Things&#xff0c;简称IOT)是指通过各种信息传感器、射频识别技术、全球定位系统、红外线感应器、激光扫描器等各种装置与技术&#xff0c;实时采集任何需要监控、 连接、互动的物体或过程&#xff0c;采集其声、光、热、电、力学、化 学、…

Python 位操作运算符

&按位与运算符&#xff1a;参与运算的两个值,如果两个相应位都为1,则该位的结果为1,否则为0(a & b) 输出结果 12 &#xff0c;二进制解释&#xff1a; 0000 1100|按位或运算符&#xff1a;只要对应的二个二进位有一个为1时&#xff0c;结果位就为1。(a | b) 输出结果 6…