Каталог данных AWS Glue в качестве хранилища метаданных для внешних сервисов, таких как Databricks

Допустим, данные находятся на AWS. Использование S3 в качестве хранилища и Glue в качестве каталога данных. Итак, мы можем легко использовать athena, redshift или EMR для запроса данных на S3, используя Glue в качестве хранилища метаданных.

У меня вопрос: можно ли предоставить каталог данных Glue в качестве хранилища метаданных для внешних сервисов, таких как Databricks, размещенных на AWS?

Obaid 16.04.2018 источник

Ответы (2)

arrow_upward
1
arrow_downward

Databricks предоставила несколько приличных документов / рецензий (см. docs и сообщение в блоге), хотя они касаются интеграции пользовательских / устаревших хранилищ Hive, а не самого Glue.

Кроме того - в качестве плана Б - должна быть возможность проверять определения таблиц / разделов, которые есть в метасторе Databricks, и выполнять одностороннюю репликацию в Glue через Java SDK (или, может быть, и наоборот. , сопоставляя ответы API AWS с последовательностями операторов create table / create partition). Конечно, это связано с довольно сложными угловыми случаями, такими как каскадное удаление разделов / таблиц и т. Д., Но для некоторых простых вещей, предназначенных только для создания, это, по крайней мере, кажется доступным.

Anton Kraievyi 26.06.2018

arrow_upward
1
arrow_downward

Теперь Databricks предоставляет документацию для создания каталога данных Glue в качестве хранилища метаданных. Это нужно сделать, выполнив следующие действия:

Создайте роль и политику IAM для доступа к каталогу данных Glue
Создайте политику для целевого каталога клеев
Найдите роль IAM, используемую для создания развертывания Databricks.
Добавьте роль IAM каталога Glue в политику EC2
Добавление роли IAM каталога Glue в рабочую область Databricks
Запуск кластера с ролью Glue Catalog IAM

Ссылка: https://docs.databricks.com/data/metastores/aws-glue-metastore.html.

matiasm 10.01.2020

Каталог данных AWS Glue в качестве хранилища метаданных для внешних сервисов, таких как Databricks

Ответы (2)

Похожие вопросы