学做企业网站学校网站管理
学做企业网站,学校网站管理,珠海网站艰涩和,怎么推广自己的信息一、consumer导致kafka积压了大量消息
场景#xff1a; 1. 如果是Kafka消费能力不足#xff0c;则可以考虑增加 topic 的 partition 的个数#xff0c; 同时提升消费者组的消费者数量#xff0c;消费数 分区数 #xff08;二者缺一不可#xff09;
2. 若是下游数据处理…一、consumer导致kafka积压了大量消息
场景 1. 如果是Kafka消费能力不足则可以考虑增加 topic 的 partition 的个数 同时提升消费者组的消费者数量消费数 分区数 二者缺一不可
2. 若是下游数据处理不及时则提高每批次拉取的数量。批次拉取数量过少 拉取数据/处理时间 生产速度使处理的数据小于生产的数据也会造成数据积压。
方法
1. 增大partion数量 2. 消费者加了并发服务 扩大消费线程 3. 增加消费组服务数量 4. kafka单机升级成了集群 5. 避免消费者消费消息时间过长导致超时 6. 使Kafka分区之间的数据均匀分布
二、消息过期失效
产生消息堆积消费不及时kafka数据有过期时间一些数据就丢失了主要是消费不及时
经验
1. 消费kafka消息时应该尽量减少每次消费时间可通过减少调用三方接口、读库等操作 从而减少消息堆积的可能性。 2. 如果消息来不及消费可以先存在数据库中然后逐条消费 还可以保存消费记录方便定位问题 3. 每次接受kafka消息时先打印出日志包括消息产生的时间戳。 4. kafka消息保留时间修改kafka配置文件 默认一周 5. 任务启动从上次提交offset处开始消费处理
三、综上使用kafka注意事项
1. 由于Kafka消息key设置,在Kafka producer处给key加随机后缀使其均衡 2. 数据量很大合理的增加Kafka分区数是关键。 Kafka分区数是Kafka并行度调优的最小单元如果Kafka分区数设置的太少 会影响Kafka consumer消费的吞吐量. 如果利用的是Spark流和Kafka direct approach方式 也可以对KafkaRDD进行repartition重分区增加并行度处理.
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/88483.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!