Насколько я понимаю, TensorFlow использует MLMD для записи и получения метаданных, связанных с рабочими процессами. Это может включать:
- результаты компонентов трубопровода
- метаданные об артефактах, генерируемых компонентами конвейеров
- метаданные о выполнении этих компонентов
- метаданные о конвейере и соответствующая информация о происхождении
Возможности:
Означает ли вышесказанное (например, №1 или результаты компонентов), что MLMD хранит фактические данные? (например, введите функции для обучения машинному обучению?). Если нет, то что это значит под результатами компонентов трубопровода?
История оркестровки и конвейера:
Кроме того, при использовании TFX, например, AirFlow, который использует собственное хранилище метаданных (например, метаданные о группах DAG, их запусках и других конфигурациях Airflow, таких как пользователи, роли и соединения), хранит ли MLMD избыточную информацию? Заменяет ли он это?