Артефакты MLflow хранятся, но не отображаются в пользовательском интерфейсе

У меня возникла проблема с использованием сервера MLflow. Когда я впервые запустил команду для запуска сервера mlflow на экземпляре ec2, все работало нормально. Теперь, хотя журналы и артефакты сохраняются в postgres и s3, пользовательский интерфейс не перечисляет артефакты. Вместо этого в разделе артефактов пользовательского интерфейса отображается:

Loading Artifacts Failed
Unable to list artifacts stored under <s3-location> for the current run. Please contact your tracking server administrator to notify them of this error, which can happen when the tracking server lacks permission to list artifacts under the current run's root artifact directory.

Но когда я проверяю s3, я вижу артефакт в месте s3, который показывает ошибка. Что могло быть причиной этого, поскольку это работало не так давно, и на ec2, на котором размещен mlflow, ничего не изменилось?


person JMV12    schedule 18.05.2020    source источник


Ответы (1)


Я нашел ответ. Ошибка заключалась в том, что mlflow не мог найти boto3, поэтому установка conda работала. Журналы для этого были похоронены, и их трудно найти в stdout.

person JMV12    schedule 18.05.2020
comment
Была такая же проблема. Я только что установил пакет boto3 через pip install и все заработало. Спасибо @ JMV12. - person Andrei Madalin Butnaru; 12.08.2020
comment
что это значит, что mlflow не может найти boto3? У меня установлен boto3 на модуле, в котором запущен mlflow, но эта ошибка все еще возникает. Не могли бы вы посоветовать исправление, которое вы применили. - person frany; 10.06.2021