Можно ли запланировать задание AWS Glue для выполнения команд восстановления MSCK, чтобы метаданные для вновь добавленного раздела добавлялись в каталог Glue?
Может ли сценарий Glue ETL выполнять команду MSCK REPAIR TABLE без вызова Athena?
Можно ли запланировать задание AWS Glue для выполнения команд восстановления MSCK, чтобы метаданные для вновь добавленного раздела добавлялись в каталог Glue?
Может ли сценарий Glue ETL выполнять команду MSCK REPAIR TABLE без вызова Athena?
Это достигается с помощью клеевых краулеров. Если вы создадите искатель, он обновит таблицу на основе новых полей и добавит новые разделы.
Для этого вы можете вызвать API batch_create_partition (). Это не требует дорогостоящих операций, таких как MSCK REPAIR TABLE или повторное сканирование. Ниже мой подробный ответ с образцом кода -
https://stackoverflow.com/a/52239022/2414855