У меня есть кластер Kafka в центре обработки данных. Группа клиентов, которые могут обмениваться данными через WAN (даже через Интернет), будут отправлять / получать сообщения в реальном времени в / из кластера.
Я прочитал из документации Кафки:
... Можно читать или записывать в удаленный кластер Kafka через глобальную сеть, хотя для соединений с высокой задержкой потребуется настройка TCP.
Как правило, не рекомендуется запускать один кластер Kafka, охватывающий несколько центров обработки данных, так как это приведет к очень высокой задержке репликации как для записи Kafka, так и для записи Zookeeper, и ни Kafka, ни Zookeeper не останутся доступными, если сетевые разделы будут разделены.
Насколько я понимаю, здесь и здесь:
- Производство через WAN не требует ZK и это нормально, просто помните о настройках TCP для соединений с высокой задержкой. Большой! Проверять.
- Для потребительских API высокого уровня требуются соединения ZK.
Разве клиенты, читающие / записывающие в Kafka через глобальную сеть, не подчиняются тем же ограничениям для кластеров, которые выделены полужирным шрифтом выше?