Я использую приложение потоковой передачи flink с источником ввода в качестве файловой системы nfs и приемником в качестве производителя kafka.
Я использую функцию непрерывного мониторинга, которая пересылает разделение файлов, которое не поддерживает терминологию, и ContinousFileOperator с терминологией.
Исходные данные, которые у нас есть, это 4 ТБ данных. для начальной передачи функции Continousmonitor требуется много времени, чтобы подготовить состояние, что нормально, но контрольные точки продолжают истекать до их завершения. Я изменил checkpointingTimeout на 3 часа, но все равно не работает.
Могу ли я узнать, что состоит из состояния контрольной точки, имеет ли значение размер данных?
Могу я узнать, как я могу определить размер штата?
Есть ли лучший способ для первоначального запуска с большими данными?