消息队列(4):Kafka

介绍

kafka是一个支持分布式的消息系统,基于发布/订阅模式。
kafka由LinkedIn公司开发,2010年成为Apache顶级项目。
源码是由java写的。

基本概念

1、Broker

kafka集群中的每台机器,都叫一个broker.

2、Topic(主题)

一个topic代表着一类消息,不同类型的消息,就用不同的topic区分。

3、Partition(分区)

一个Partition就是一个队列。一个topic可以由多个Partition组成。
一个topic的多个partition可能会放在多个Broker上。

4、Producer(生产者)

向kafka发消息的客户端

5、Consumer(消费者)

从kafka拉消息的客户端

6、Consumer Group(消费者组)

这个相当于给消费者分了个组,在注册消费者的时候,要先指定是哪个消费者组。
这个概念,主要是为了kafka实现广播和单播的区分。
每多一个消费者组,topic的消息就会多复制一份给这个消费者组。
消费者组只会把消息发给本组的一个消费者。
这样的话,如果实现单播,那就一个消费者一个消费者组;如果要广播,那就多个消费者用一个消费者组。

7、Zookeeper

zk主要就是集群管理,包括Broker和Consumer。

图解

发现有网友画的一张很好的图,把kafka的数据流画的很清晰。
在这里插入图片描述
如上图,简单解释下:
有两个producer,producer0发topic0的消息,producer1发topic0和topic1的消息。
有3个broker作为一个集群,由zk管理,上图没画zk,自行脑补。
我们看到数据存储的最小单位是topic的某个partition。
这个图,为每个Partition做了两个副本,我们称为一主两从。
主用红色标识,从用黑色标识。
producer发消息都是发到主上,然后由主复制消息到从上。
消费者拉消息,也是从主上拉。
主从关系由zk来管理,基本上就是zk选举那一套。
consumer group0有一个消费者consumer0。
consumer0消费topic0的消息,所以我们看到consumer0从topic0的两个partition上同时拉消息。
consumer group1有三个consumer,012。
这里先指出一个上图的问题,一般一个consumer group是只消费一个topic的,我理解的是作者为了画出消费者数量与partition数据的关系,才这么画的,我们一个一个讲。

首先看consumer group1消费topic0的情况,topic0有两个partition,但consumer group1有三个consumer,所以consumer0负责拉topic0partiton0队列的消息,consumer1负责拉topic0partition1队列的消息。

再看consumer group1消费topic1的情况。由于topic1只有一个partition0,所以consumer group1也就只派出consumer0来拉这个topic1partition0的消息。

如果你认认真真把上面的看完,那么你应该能理解,所谓的一个topic多少个partition对于多少个consumer了吧。还是以3个为例,理想状况下,就是3个broker,对于一个tipic的3个partition的主分别部署在不同的broker上,主对于的两个从分别不在其他两个broker上。同时consumer group对应有3个consumer,分别从3个partition主上拉消息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/499784.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

clickhouse的ReplacingMergeTree引擎实战

学习ReplacingMergeTree引擎,首先你得了解clickhouse的MergeTree引擎,因为ReplacingMergeTree引擎是MergeTree引擎的一个扩展版引擎,他拥有和MergeTree一样的功能,同时新增了一个删除相同主键数据的功能。 我们知道,cl…

clickhouse 分片

我们知道mysql数据库如果想做分片,需要使用第三方组件,这是因为mysql在设计之初就没有太多考虑分布式等问题。而clickhouse作为新生代性能之王,分片也是必须的功能。基本上从2015年之后的各种数据库也罢,框架也罢,都开…

[记录] ---阿里云java.io.IOException: Connection reset by peer的问题

项目部署到阿里云,突然报错,频繁的打印堆栈信息,一开始是把堆内存打满导致服务一直重启,调大堆内存后就不影响正常服务了,但还是一直打堆栈,虽说日志会自动清理,但一直打这个信息着实不好看。 最…

数据库缓存双写一致性的一些个人想法

数据库缓存双写一致性的一些个人想法 有这么个问题,还是经典面试题: 说我们有个数据库,他的读请求特别多,以至于要在数据库上加一层缓存来抗压,这个都能理解吧。 这里的缓存,可能是和数据库一样的数据&am…

2020年规划

1.去其他城市,市级城市超过3个。 2.继续想着通过其他方式赚钱。 3.选一个技术体系,搞精通,比如数据库,比如高并发分布式等 4.搞个自己的网站,国庆前平均每天100访问量。 5.12点前睡觉 2020年1月5日,2020年…

实用的java代码生成器,开箱即用(基于mybatisplus的AutoGenerator)

spring-boot工程下&#xff0c;自动生成代码&#xff0c;controller层&#xff0c;service层&#xff0c;mapper层。 根据数据库配置好的表&#xff0c;逆向生成实体类和各层结构 1、引入maven <dependency><groupId>com.baomidou</groupId><artifactId&…

mac/windows 端口占用解决记录

idea启动报错&#xff1a;端口占用 The port may already be in use or the connector may be misconfigured mac端口占用解决 zhangshuaideMacBook-Pro:~ zhangshuai$ lsof -i:8095 COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME Google 375 zhangshuai 32u IPv6 0x…

[配置中心] --- consul

mac下载安装consul 1、下载&#xff1a;consul下载地址 2、解压到目录/usr/local/bin下 3、执行consul文件 4、验证&#xff1a;控制台输入consul验证 5、启动consul&#xff1a;consul agent -dev windows安装consul 1、下载&#xff0c;解压到D:\soft&#xff0c;将这个路…

[java基础] --- java开发,service层是不是一定要写接口

估计很多java开发的同学都遇到过&#xff0c;service层要写一个接口&#xff0c;然后再写接口的实现类&#xff0c;但这个接口从项目开始到项目倒闭&#xff0c;都不会有第二个实现&#xff0c;那为什么不直接写个service类呢&#xff1f;如果你还没想过这个问题&#xff0c;那…

浅谈权限(功能权限数据权限)

一般企业上的权限部分&#xff0c;都是区分为功能权限和数据权限。 一、功能权限 功能权限&#xff0c;就是用户登录后&#xff0c;能看到哪些菜单&#xff0c;能看到哪些按钮&#xff0c;能执行哪些操作的权限。 一般&#xff0c;功能权限&#xff0c;已经都有很成熟的业内方…

一个技术负责人应该知道的规范细节

前言&#xff1a; 作为一个技术负责人&#xff0c;不能只定义一个项目的技术选型&#xff0c;而不注意开发细节。 开发前&#xff0c;如果不预先定义好规范&#xff0c;那么项目中就会乱成一锅粥。每个人自成一派&#xff0c;单看每个人的模块&#xff0c;貌似都没啥大问题&am…

skywalking(1) 基于opentracing规范的APM系统

skywalking是&#xff1a; 基于opentracing规范的APM系统 skywalking解决了什么问题&#xff1f; skywalking解决微服务架构下&#xff0c;多服务直接复杂的调用关系 了解dapper&#xff0c;分布式链路追踪系统 dapper又是谷歌论文&#xff0c;各公司又相继模仿。&#xff…

skywalking(2)

安装 1、安装jdk 2、安装es 3、安装skywalking&#xff08;backend和ui&#xff09; 应用启动时添加探针&#xff08;agent&#xff09; 使用 java -javaagent:/aa/bb/boot.jar -Dserver.port8081 -jar boot.jar 启动项目jar包 查看调用链&#xff0c;追踪等 仪表盘&#…

skywalking(3)

javaagent原理 skywalking实现代码无侵入&#xff0c;就是用了javaagent javaagent是java命令的一个参数&#xff0c;可以用于指定一个jar包 这个jar包中的MANIFEST.MF中&#xff0c;必须指定Premain-Class项 Premain-Class指定的那个类&#xff0c;必须实现premain()方法 当…

skywalking(4)

Byte Buddy库 统计方法调用时长 1、增强字节码 2、拦截器拦截 类似于spring的aop&#xff0c;只不过skywalking不能用aop&#xff0c;所以用Byte Buddy技术代替 Open Trace 整个trace调用&#xff0c;是由多个span组成的有向无环图&#xff08;就是调用关系图&#xff09;。…

kubernetes(k8s)

应用部署演进过程 我们从上图可以看到&#xff0c;应用越来越看重应用本身了&#xff0c;慢慢的不受物理机的差异&#xff0c;不受操作系统的差异&#xff0c;开发者可以花更多精力去到应用本身。 k8s概念 简单理解&#xff0c;k8s就是传统的云平台上的linux。 kubernetes是…

jenkins+k8s实现持续集成

持续集成&#xff08;CI&#xff09; 集成是指开发人员将代码提交到git或svn 持续集成是指让开发人员持续提交代码&#xff0c;写一点就提交一点&#xff0c;这样就会更早的发现代码差异 每次集成&#xff0c;都可以通过自动化的构建来验证 自动化构建包括&#xff1a;编译&am…

为什么要用Elasticsearch

概念 Elasticsearch 简称ES&#xff0c;是一个分布式全文检索引擎。 比如github的代码检索就是用了ES&#xff0c;百度也有用ES。 由于Lucene的api相对比较复杂&#xff0c;所以ES其实是对Lucene的封装简化&#xff0c;并且提供了一套比较简单的api文档。 es官网 使用场景 主…

[设计模式] ------ 建造者模式(对比模板模式)

建造者模式 建造者模式&#xff0c;是为了构建一类具有相同执行顺序的但实现不一样&#xff0c;最后产生不一样的东西的效果。 举个例子&#xff0c;比如写作文。 每次写作文&#xff0c;我们大致有写标题&#xff0c;写开头&#xff0c;写内容&#xff0c;写结尾这些步骤。…

[设计模式] ------ 观察者模式和他的升级版发布订阅模式

概念 观察者模式&#xff0c;原理很简单&#xff0c;把A类的子类分别注入到B类中&#xff0c;通过用B类调用方法&#xff0c;循环调用A类的方法&#xff0c;就是所谓观察者模式 伪代码如下&#xff0c;最快的速度理解观察者模式&#xff1a; 接口 A{// 观察者接口notify(); …