TL;DR
В рамках миссии VESSL по созданию современной инфраструктуры, инструментов и рабочих процессов для машинного обучения сегодня мы выпускаем tvault
. tvault
— это локальный реестр моделей, созданный для того, чтобы помочь академическим исследователям в области машинного обучения быстрее итерировать свои модели без дополнительных затрат на ведение журналов. Вы можете думать об этом как о легком «git diff for ML», где вы можете отслеживать и хэшировать свои эксперименты, а также получать общее представление об изменениях между двумя экспериментами.
Проблема
За последний год мы познакомились с сотнями аспирантов, изучающих искусственный интеллект и машинное обучение, через VESSL для академиков и внедрение VESSL в масштабах всего кампуса. В то время как небольшая часть из них является активным пользователем полноценных инструментов отслеживания экспериментов, таких как VESSL Experiments и Weights & Biases, многие из академических исследователей, с которыми мы сталкиваемся, просто хотят начать работу с минимальной настройкой и сосредоточиться на самом важном. — модели. Учитывая, что ученые-исследователи работают более независимо и больше внимания уделяют алгоритмам, а не тонкой настройке с помощью нескольких итераций, это имеет смысл.
Как это работает
С помощью tvault
вы можете начать работу с самой простой формой отслеживания экспериментов всего лишь с помощью pip install
— без регистрации или дополнительной настройки — и управлять и сравнивать эксперименты в своем терминале.
Добавление tvault.log()
в цикл обучения вашего кода создает локальный файл журнала в папке model_log
с уникальным хэшем для вашей модели и идентификатором для каждого запуска. Этот файл журнала, по сути, является считыванием вашей модели, в котором хранится обзор модели и ключевые показатели, такие как точность, скорость обучения и оптимизатор, которые вы можете добавить с помощью тегов. Поскольку журналы tvault
находятся в папке вашего проекта, вы также можете поделиться ходом своего эксперимента, когда вы отправляете git push в свою локальную кодовую базу, и сделать их общедоступными на GitHub, как только вы будете готовы опубликовать свое исследование.
все за 1 минуту
После того как вы вставите tvault.log()
в цикл обучения вместе с метриками, которые хотите отслеживать, в виде тегов, вы сможете искать и сравнивать эксперименты с помощью простой команды CLI.
Поисковые эксперименты с find_flag
Вы можете искать свои эксперименты по хешу, результату или тегам, используя --find_flag
и указав --condition
. В приведенном ниже примере показаны все эксперименты с точностью от 50
до 100
.
Сравните эксперименты с diff_flag
Параметр diff_flag
tvault позволяет вам найти разницу между двумя моделями, указав хэш и индекс модели. tvault
автоматически обнаруживает и отображает изменения в функциях при удалении git diffs, не связанных с моделью. Это полезно, когда у вас есть базовая модель, которую вы хотите повторить с различными гиперпараметрами и архитектурами более высокого уровня, не копаясь в вашем коде построчно.
Что дальше
В то время как MLOps имеет важное значение для производственного машинного обучения в масштабе и скорости, текущий ландшафт проектирования и инструментов может быть непосильным, особенно для дипломированных исследователей машинного обучения. Мы считаем, что минимально жизнеспособные инструменты, такие как tvault
, которые дают пользователям мгновенную ценность с нулевыми накладными расходами, будут мотивировать их исследовать больше, а не просто игнорировать. Мы с нетерпением ждем возможности выпустить больше фреймворков с открытым исходным кодом, которые помогут инженерам и исследователям в области ИИ/МО начать работу с MLOps — например, шаблоны Terraform для настройки мультиоблачных кластеров Kubernetes.
Для тех, кто хочет внедрить полноценную, готовую к работе инфраструктуру искусственного интеллекта и MLOps в течение нескольких дней, а не месяцев, зарегистрируйте бесплатную учетную запись и начните обучение на https://vessl.ai.
—
Йонг Хи, менеджер по развитию
Дэвид О, стажер инженера по машинному обучению