Время выполнения
Пряжа кластерный режим
заявка
- Структурированная потоковая передача Spark
- Чтение данных из темы Kafka
О теме Кафки
- 1 тема с 4 разделами - пока. (количество разделов можно изменить)
- Добавлено максимум 2000 записей в тему за 1 секунду.
Я обнаружил, что количество тематических разделов Kafka совпадает с количеством исполнителей искры (1: 1).
Итак, в моем случае, что я знаю до сих пор, я думаю, что 4 искровых исполнителя - это решение.
Но меня беспокоит пропускная способность - можно ли обеспечить 2000 рек / сек?
Есть ли какие-либо указания или рекомендации по настройке правильной конфигурации в искровой структурированной потоковой передаче?
Особенно spark.executor.cores
, spark.executor.instances
или что-то про исполнителя.