其他分享
首页 > 其他分享> > Kafka - Kafka 生产者

Kafka - Kafka 生产者

作者:互联网

一、Kafka生产者 如何将消息发送到 kafka集群?

将下图纵向分为4列:

1)生产者的主线程

Producer对象:生成一个该对象,然后调用send方法

拦截器:不是必须的,可选

序列化器:kafka自己的更轻便,大部分都是数据,保证安全校验的只是小部分;而Java数据只占一小部分,大部分都是安全校验。因此在大数据的情况下,不能用Java自带的序列化功能。

分区器:这里的分区器,只是分recordAccumulator的区域,分到哪个DQueue

 

2)RecordAccumulator

该部分都在内存中,默认大小是32M

该部分有两个参数要注意 batch.size 和 linger.ms,具体含义见图。

这部分还有个内存池:

在生产者发送数据时,会从内存池拿内存用来储存数据;

待kafka集群成功接收到数据后,数据从DQueue删除释放内存,再归还给内存池

 

3)生产者的sender线程

sender线程会主动拉取数据。拉取数据的条件是batch.size 或 linger.ms,任何一个符合要求了就能拉取。

sender能容忍某个broker不返回应答的个数,是5。如果发了5个数据,都没有答复,那就不会再给该broker发送。

如果成功收到应答acks,就会清理掉DQueue里的数据;

如果发送不成功,会重试。该值默认设置的是Integer.MAX_VALUE

 

4)kafka集群

返回的应答种类,见图。

 

 

标签:sender,生产者,kafka,内存,DQueue,Kafka,数据
来源: https://www.cnblogs.com/frankcui/p/16065365.html