网站的维护及建设显示屏东莞网站建设

web/2025/9/26 5:32:21/文章来源:

网站的维护及建设,显示屏东莞网站建设,企业简介范文大全,微山网站建设多少钱从 Zookeeper 数据理解 Kafka 集群工作机制这一部分主要是理解 Kafka 的服务端重要原理。但是 Kafka 为了保证高吞吐#xff0c;高性能#xff0c;高可扩展的三高架构#xff0c;很多具体设计都是相当复杂的。如果直接跳进去学习研究#xff0c;很快就会晕头转向。所以高性能高可扩展的三高架构很多具体设计都是相当复杂的。如果直接跳进去学习研究很快就会晕头转向。所以找一个简单清晰的主线就显得尤为重要。这一部分主要是从可见的存储数据的角度来理解Kafka 的 Broker 运行机制。这对于上一章节建立的简单模型是一个很好的细节补充。 Kafka 依赖很多的存储数据但是总体上是有划分的。 Kafka 会将每个服务的不同之处也就是状态信息保存到Zookeeper 中。通过 Zookeeper 中的数据指导每个 Kafka 进行与其他 Kafka 节点不同的业务逻辑。而将状态信息抽离后剩下的数据就可以直接存在Kafka 本地所有 Kafka 服务都以相同的逻辑运行。这种状态信息分离的设计让Kafka 有非常好的集群扩展性。 Kafka 的 Zookeeper 元数据梳理 1 、 zookeeper 整体数据 Kafka 将状态信息保存在 Zookeeper 中这些状态信息记录了每个 Kafka 的 Broker 服务与另外的 Broker 服务有什么不同。通过这些差异化的功能共同体现出集群化的业务能力。这些数据需要在集群中各个Broker之间达成共识因此需要存储在一个所有集群都能共同访问的第三方存储中。 Kafka 在 Zookeeper 上管理了哪些数据呢这个问题可以先回顾一下 Kafka 的整体集群状态结构然后再去Zookeeper上验证。 Kafka 的整体集群结构如下图。其中红色字体标识出了重要的状态信息。 Kafka 的集群中最为主要的状态信息有两个。一个是在多个 Broker 中需要选举出一个 Broker 担任Controller角色。由 Controller 角色来管理整个集群中的分区和副本状态。另一个是在同一个 Topic 下的多个Partition中需要选举出一个 Leader 角色。由 Leader 角色的 Partition 来负责与客户端进行数据交互。这些状态信息都被 Kafka 集群注册到了 Zookeeper 中。 Zookeeper 数据整体如下图对于 Kafka 往 Zookeeper 上注册的这些节点大部分都是比较简明的。比如 /brokers/ids 下会记录集群中的所有BrokerId /topics 目录下会记录当前 Kafka 的 Topic 相关的 Partition 分区等信息。下面就从这些Zookeeper的基础数据开始来逐步梳理 Kafka 的 Broker 端的重要流程。例如集群中每个 Broker 启动后都会往 Zookeeper 注册一个临时节点 /broker/ids/{BrokerId} 。可以做一个试验验证一下。如果启动了Zookeeper 和 Kafka 后服务器非正常关机这时 Zookeeper 上的这个临时节点就不会注销。下次重新启动Kafka 时就有可能因为无法注册上这个临时节点而报错。 2 、 Controller Broker 选举机制在 Kafka 集群进行工作之前需要选举出一个 Broker 来担任 Controller 角色负责整体管理集群内的分区和副本状态。选举Controller 的过程就是通过抢占 Zookeeper 的 /controller 节点来实现的。当一个集群内的 Kafka 服务启动时就会尝试往 Zookeeper 上创建一个 /controller 临时节点并将自己的brokerid写入这个节点。节点的内容如下 Zookeeper 会保证在一个集群中只会有一个 broker 能够成功创建这个节点。这个注册成功的 broker 就成了集群当中的Controller 节点。当一个应用在 Zookeeper 上创建了一个临时节点后 Zookeeper 需要这个应用一直保持连接状态。如果Zookeeper长时间检测不到应用的心跳信息就会删除临时节点。同时 Zookeeper 还允许应用监听节点的状态当应用状态有变化时会向该节点对应的所有监听器广播节点变化事件。这样如果集群中的 Controller 节点服务宕机了 Zookeeper 就会删除 /controller 节点。而其他未注册成功的Broker 节点就会感知到这一事件然后开始竞争再次创建临时节点。这就是 Kafka 基于 Zookeeper的Controller 选举机制。选举产生的 Controller 节点就会负责监听 Zookeeper 中的其他一些关键节点触发集群的相关管理工作。例如 · 监听 Zookeeper 中的 /brokers/ids 节点感知 Broker 增减变化。 · 监听 /brokers/topics 感知 topic 以及对应的 partition 的增减变化。 · 监听 /admin/delete_topic 节点处理删除 topic 的动作。另外 Controller 还需要负责将元数据推送给其他 Broker 。 3 、 Leader Partition 选举机制在 Kafka 中一个 Topic 下的所有消息是分开存储在不同的 Partition 中的。在使用 kafka-topics.sh 脚本创建Topic 时可以通过 --partitions 参数指定 Topic 下包含多少个 Partition 还可以通过 --replication-factors 参数指定每个Partition 有几个备份。而在一个 Partition 的众多备份中需要选举出一个 Leader Partition 负责对接所有的客户端请求并将消息优先保存然后再通知其他Follower Partition 来同步消息。在理解 Leader Partition 选举机制前需要了解几个基础的概念 · AR: Assigned Repllicas 。表示 Kafka 分区中的所有副本 ( 存活的和不存活的 ) · ISR: 表示在所有 AR 中服务正常保持与 Leader 同步的 Follower 集合。如果 Follower 长时间没有向Leader发送通信请求 ( 超时时间由 replica.lag.time.max.ms 参数设定默认 30S) 那么这个 Follower就会被提出ISR 中。 ( 在老版本的 Kafka 中还会考虑 Partition 与 Leader Partition 之间同步的消息差值大于参数replica.lag.max.messages 条就会被移除 ISR 。现在版本已经移除了这个参数。 ) · OSR 表示从 ISR 中踢出的节点。记录的是那些服务有问题延迟过多的副本。其中 AR 和 ISR 比较关键可以通过 kafka-topics.sh 的 --describe 指令查看。这个结果中 AR 就是 Replicas 列中的 Broker 集合。而这个指令中的所有信息其实都是被记录在 Zookeeper 中的。接下来 Kafka 设计了一套非常简单高效的 Leader Partition 选举机制。在选举 Leader Partition 时会按照 AR 中的排名顺序靠前的优先选举。只要当前 Partition 在 ISR 列表中也就是是存活的那么这个节点就会被选举成为 Leader Partition 。例如我们可以设计一个实验来验证一下 LeaderPartiton 的选举过程。从实验中可以看到当 BrokerId2 的 kafka 服务停止后 2 号 BrokerId 就从所有 Partiton 的 ISR 列表中剔除了。然后Partition2 的 Leader 节点原本是 Broker2 当 Broker2 的 Kafka 服务停止后都重新进行了 Leader选举。Parition2 预先评估的是 Replicas 列表中 Broker2 后面的 Broker1 Broker1 在 ISR 列表中所以他被最终选举成为Leader 。当 Partiton 选举完成后 Zookeeper 中的信息也被及时更新了。 Leader Partitoin 选举机制能够保证每一个 Partition 同一时刻有且仅有一个 Leader Partition 。但是是不是只要分配好了 Leader Partition 就够了呢 4 、 Leader Partition 自动平衡机制在一组 Partiton 中 Leader Partition 通常是比较繁忙的节点因为他要负责与客户端的数据交互以及向Follower同步数据。默认情况下 Kafka 会尽量将 Leader Partition 分配到不同的 Broker 节点上用以保证整个集群的性能压力能够比较平均。但是经过 Leader Partition 选举后这种平衡就有可能会被打破让 Leader Partition 过多的集中到同一个Broker 上。这样这个 Broker 的压力就会明显高于其他 Broker 从而影响到集群的整体性能。为此 Kafka 设计了 Leader Partition 自动平衡机制当发现 Leader 分配不均衡时自动进行 Leader Partition 调整。 Kafka在进行 Leader Partition 自平衡时的逻辑是这样的他会认为 AR 当中的第一个节点就应该是 Leader 节点。这种选举结果成为 preferred election 理想选举结果。 Controller 会定期检测集群的 Partition 平衡情况在开始检测时Controller 会依次检查所有的 Broker 。当发现这个 Broker 上的不平衡的 Partition 比例高于leader.imbalance.per.broker.percentage 阈值时就会触发一次 Leader Partiton 的自平衡。这是官方文档的部分截图。这个机制涉及到 Broker 中 server.properties 配置文件中的几个重要参数另外你也可以通过手动调用 kafka-leader-election.sh 脚本触发一次自平衡。例如但是要注意这样 Leader Partition 自平衡的过程是一个非常重的操作因为要涉及到大量消息的转移与同步。并且在这个过程中会有丢消息的可能。所以在很多对性能要求比较高的线上环境会选择将参数auto.leader.rebalance.enable设置为 false 关闭 Kafka 的 Leader Partition 自平衡操作而用其他运维的方式在业务不繁忙的时间段手动进行Leader Partiton 自平衡尽量减少自平衡过程对业务的影响。至于为什么会丢消息。下一章节就会给出答案。 5 、 Partition 故障恢复机制 Kafka 设计时要面对的就是各种不稳定的网络以及服务环境。如果 Broker 的服务不稳定随时崩溃 Kafka集群要怎么保证数据安全呢当一组 Partition 中选举出了一个 Leader 节点后这个 Leader 节点就会优先写入并保存 Producer 传递过来的消息然后再同步给其他Follower 。当 Leader Partition 所在的 Broker 服务发生宕机时 Kafka 就会触发Leader Partition的重新选举。但是在选举过程中原来 Partition 上的数据是如何处理的呢 Kafka 为了保证消息能够在多个 Parititon 中保持数据同步内部记录了两个关键的数据 · LEO(Log End Offset): 每个 Partition 的最后一个 Offset 这个参数比较好理解每个 Partition 都会记录自己保存的消息偏移量。 leader partition 收到并记录了生产者发送的一条消息就将LEO 加 1 。而接下来 follower partition 需要从 leader partition 同步消息每同步到一个消息自己的LEO 就加 1 。通过 LEO 值就知道各个 follower partition 与 leader partition 之间的消息差距。 · HW(High Watermark): 一组 Partiton 中最小的 LEO 。 follower partition 每次往 leader partition 同步消息时都会同步自己的 LEO 给 leader partition 。这样 leader partition 就可以计算出这个 HW 值并最终会同步给各个 follower partition 。 leader partition 认为这个HW 值以前的消息都是在所有 follower partition 之间完成了同步的是安全的。这些安全的消息就可以被消费者拉取过去了。而HW 值之后的消息就是不安全的是可能丢失的。这些消息如果被消费者拉取过去消费了就有可能造成数据不一致。也就是说在所有服务都正常的情况下当一个消息写入到 Leader Partition 后并不会立即让消费者感知。而是会等待其他Follower Partition 同步。这个过程中就会推进 HW 。当 HW 超过当前消息时才会让消费者感知。比如在上图中4 号往后的消息虽然写入了 Leader Partition 但是消费者是消费不到的。当服务出现故障时如果是 Follower 发生故障这不会影响消息写入只不过是少了一个备份而已。处理相对简单一点。Kafka 会做如下处理 1. 将故障的 Follower 节点临时提出 ISR 集合。而其他 Leader 和 Follower 继续正常接收消息。 2. 出现故障的 Follower 节点恢复后不会立即加入 ISR 集合。该 Follower 节点会读取本地记录的上一次的HW将自己的日志中高于 HW 的部分信息全部删除掉然后从 HW 开始向 Leader 进行消息同步。 3. 等到该 Follower 的 LEO 大于等于整个 Partiton 的 HW 后就重新加入到 ISR 集合中。这也就是说这个Follower的消息进度追上了 Leader 。如果是 Leader 节点出现故障 Kafka 为了保证消息的一致性处理就会相对复杂一点。 1. Leader 发生故障会从 ISR 中进行选举将一个原本是 Follower 的 Partition 提升为新的 Leader 。这时消息有可能没有完成同步所以新的Leader 的 LEO 会低于之前 Leader 的 LEO 。 2. Kafka 中的消息都只能以 Leader 中的备份为准。其他 Follower 会将各自的 Log 文件中高于 HW 的部分全部清理掉然后从新的Leader 中同步数据。 3. 旧的 Leader 恢复后将作为 Follower 节点进行数据恢复。在这个过程当中 Kafka 注重的是保护多个副本之间的数据一致性。但是这样消息的安全性就得不到保障。例如在上述示例中原本Partition0 中的 4 5 6 7 号消息就被丢失掉了。在这里你或许会有一个疑问这个机制中有一个很重要的前提就是各个 Broker 中记录的 HW 是一致的。但是 HW 和 LEO 同样是一个分布式的值怎么保证 HW 在多个 Broker 中是一致的呢 6 、 HW 一致性保障 -Epoch 更新机制有了 HW 机制后各个 Partiton 的数据都能够比较好的保持统一。但是实际上 HW 值在一组 Partition 里并不是总是一致的。 Leader Partition 需要计算出 HW 值就需要保留所有 Follower Partition 的 LEO 值。但是对于 Follower Partition 他需要先将消息从 Leader Partition 拉取到本地才能向 Leader Partition上报LEO 值。所有 Follower Partition 上报后 Leader Partition 才能更新 HW 的值然后 Follower Partition 在下次拉取消息时才能更新HW 值。所以 Leader Partiton 的 LEO 更新和 Follower Partition 的 LEO 更新在时间上是有延迟的。这也导致了Leader Partition 上更新 HW 值的时刻与 Follower Partition 上跟新 HW 值的时刻是会出现延迟的。这样如果有多个Follower Partition 这些 Partition 保存的 HW 的值是不统一的。当然如果服务一切正常最终Leader Partition 还是会正常推进 HW 能够保证 HW 的最终一致性。但是当 Leader Partition 出现切换所有的 Follower Partition 都按照自己的 HW 进行数据恢复就会出现数据不一致的情况。因此 Kafka 还设计了 Epoch 机制来保证 HW 的一致性。 1. Epoch 是一个单调递增的版本号每当 Leader Partition 发生变更时该版本号就会更新。所以当有多个Epoch 时只有最新的 Epoch 才是有效的而其他 Epoch 对应的 Leader Partition 就是过期的无用的Leader 。 2. 每个 Leader Partition 在上任之初都会新增一个新的 Epoch 记录。这个记录包含更新后端的 epoch 版本号以及当前Leader Partition 写入的第一个消息的偏移量。例如 (1,100) 。表示 epoch 版本号是 1 当前Leader Partition写入的第一条消息是 100. Broker 会将这个 epoch 数据保存到内存中并且会持久化到本地一个leader-epoch-checkpoint 文件当中。 3. 这个 leader-epoch-checkpoint 会在所有 Follower Partition 中同步。当 Leader Partition 有变更时新的Leader Partition 就会读取这个 Epoch 记录更新后添加自己的 Epoch 记录。 4. 接下来其他 Follower Partition 要更新数据时就可以不再依靠自己记录的 HW 值判断拉取消息的起点。而可以根据这个最新的epoch 条目来判断。这个关键的 leader-epoch-checkpoint 文件保存在 Broker 上每个 partition 对应的本地目录中。这是一个文本文件可以直接查看。他的内容大概是这样样子的其中第一行版本号第二行表示下面的记录数。这两行数据没有太多的实际意义。从第三行开始可以看到两个数字。这两个数字就是 epoch 和 offset 。 epoch 就是表示 leader 的 epoch 版本。从0 开始当 leader 变更一次 epoch 就会 1 。 offset 则对应该 epoch 版本的 leader 写入第一条消息的offset。可以理解为用户可以消费到的最早的消息 offset 。 7 、章节总结 Kafka 其实天生就是为了集群而生即使单个节点运行 Kafka 他其实也是作为一个集群运行的。而 Kafka为了保证在各种网络抽风服务器不稳定等复杂情况下保证集群的高性能高可用高可扩展三高做了非常多的设计。而这一章节其实是从可见的Zookeeper 注册信息为入口理解 Kafka 的核心集群机制。回头来看今天总结的这些集群机制其实核心都是为了保持整个集群中Partition 内的数据一致性。有了这一系列的数据一致性保证Kafka 集群才能在复杂运行环境下保持高性能、高可用、高可扩展三高特性。而这其实也是我们去理解互联网三高问题最好的经验。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/web/82021.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！