У меня есть один экземпляр kafka, установленный на виртуальной машине с 8 ядрами и 32 ГБ ОЗУ.
Я пишу в него (производлю) с 10 разных машин и потребляю с одной машины, которые все в одной сети.
Размер данных, которые я выдаю, составляет ~35МБит/с.
По какой-то причине большую часть времени я не могу потреблять более ~ 10 МБит / с (в течение ограниченного периода времени мне удается потреблять все произведенные данные), даже несмотря на то, что кафка И серверы-потребители в основном простаивают (поэтому я не думаю, что это проблема удержания).
Может ли kafka игнорировать некоторые из полученных данных?
Некоторые значения параметров, которые могут быть полезны для анализа:
num.network.threads=32
num.io.threads=16
message.max.bytes=2147483647
num.partitions=10
log.retention.ms=120000 (2 minutes)