Я разрабатываю различные сервисы, которые напрямую общаются с BigQuery, передавая строки в базу данных. Прямо сейчас я обновляю схему непосредственно из облачного интерфейса Google, который вызывает проблемы, как вы можете себе представить, из-за забывчивости!
Я хотел бы понять, как лучше всего согласовать код и схемы для того, что все еще является быстро развивающимися сервисами и схемами.
Мои текущие идеи:
- используйте что-то вроде Terraform, но я не уверен, как это работает с живыми таблицами, которые необходимо обновить или перенести.
- добавить в сервис код для проверки/установки схемы, что бы хоть ошибки выдавало, если не автоматизировать процесс
Заранее спасибо!
РЕДАКТИРОВАТЬ:
Чтобы внести больше ясности, просьба в комментариях; мы используем облачные микросервисы для потоковой передачи строк в bigquery, сервисы написаны на python/node. Их основная цель — выполнить небольшое преобразование данных и сохранить их в BQ.
Не совсем уверен, что еще добавить, мой идеальный сценарий заключается в том, что у нас есть что-то в коде, который также определяет или, по крайней мере, проверяет схему, чтобы синхронизировать код и базу данных.
bq
командную строку Инструмент может стать хорошей отправной точкой для выполнения почти всех действий по управлению Bigquery. Можете ли вы подробнее рассказать о первоначальном задании, чтобы получить более подробную информацию об ожидаемой функциональности? - person Nick_Kh   schedule 25.09.2020