TL; DR PyTorch Lightning используется некоторыми довольно интересными проектами сообщества, чтобы делать больше с ИИ. В этой серии статей я расскажу о некоторых из моих любимых проектов сообщества, которые вдохновляют меня делать больше с ИИ.
PyTorch Lighting - это легкая оболочка PyTorch для высокопроизводительных исследований искусственного интеллекта. PyTorch Lightning обеспечивает истинную гибкость за счет сокращения количества инженерных шаблонов и ресурсов, необходимых для реализации современного искусственного интеллекта. Организация кода PyTorch с помощью Lightning обеспечивает беспрепятственное обучение на нескольких графических процессорах, TPU, CPU и использование сложных для реализации передовых методов, таких как сегментирование модели и даже с 16-битной точностью без изменения кода.
1. NVIDIA NeMo
NeMo - это набор инструментов, который позволяет создавать сложные нейронные архитектуры для разговорного ИИ с использованием многоразовых нейронных модулей. Нейронные модули обычно представляют уровни данных, кодировщики, декодеры, языковые модели, функции потерь или методы комбинирования активаций. Инструментарий поставляется с расширяемыми коллекциями предварительно созданных модулей и готовых к использованию моделей для:
- Автоматическое распознавание речи (ASR)
- Обработка естественного языка (NLP)
- Синтез речи, или преобразование текста в речь (TTS)
Используя PyTorch Lightning, NeMo может масштабировать обучение на несколько графических процессоров и несколько узлов.
2. Астероид
Asteroid - это набор инструментов для разделения источников звука, который позволяет быстро экспериментировать с общими наборами аудиоданных. Он поддерживает широкий спектр наборов данных и архитектур, а также набор рецептов для воспроизведения некоторых важных документов, включая ConvTasnet (Луо и др.), Таснет (Луо и др.), Глубокую кластеризацию ( Hershey et al. И Isik et al.), Chimera ++ (Luo et al. И Wang et al.), DualPathRNN (Luo et al.), Two пошаговое обучение ( Цинис и др. ) и др.
3. Классификация городского шума: стремление к справедливому сравнению
Набор данных UrbanSound 8k содержит 8732 помеченных звуковых отрывка (‹= 4 с) городских звуков из 10 классов: air_conditioner, car_horn, children_playing, dog_bark, Drilling, enginge_idling, gun_shot, jackhammer, siren и street_music.
Классы взяты из городской звуковой таксономии. Все выдержки взяты из полевых записей, загруженных на www.freesound.org.
Это репо содержит код для статьи: Классификация городского шума: стремление к справедливому сравнению. Он представляет собой отличный пример того, как Lightning можно использовать для создания справедливого сравнения различных моделей, используя одно и то же входное представление, метрики и оптимизатор для оценки производительности.
4. Педальная сетка
Это воссоздание PyTorch Lightning модели из Эмуляции гитарного усилителя в реальном времени с глубоким обучением, созданной нашим Grid.ai Тедди Кокером. Это действительно крутой пример того, как использовать Lightning для имитации эффектов педалей устройств, которые изменяют звучание электрогитар.
Вдобавок у Тедди есть действительно крутая запись в блоге на эту тему, и он является повсюду рок-звездой, обязательно ознакомьтесь с ней!
Вот и все, четыре потрясающих проекта Audio PyTorch Lightning, которыми можно вдохновиться. Если вы считаете, что я пропустил интересный комментарий к проекту PyTorch Lightning Audio ниже, я его проверю!
Следующие шаги
Пока вы здесь, если вы когда-либо хотели масштабировать свое обучение PyTorch Lightning со своего ноутбука в облако, не меняя ни одной строчки кода, обязательно ознакомьтесь с grid.ai, который в настоящее время находится в закрытом предварительном просмотре. Вы можете зарегистрироваться в листе ожидания по ссылке ниже.
Мы также всегда ищем более талантливых людей, чтобы присоединиться к команде Lightning. Лучший способ привлечь внимание - это внести свой вклад и отправить свое резюме по электронной почте на адрес [email protected]!
об авторе
Аарон (Ари) Борнштейн - исследователь искусственного интеллекта, увлеченный историей, занимающийся новыми технологиями и вычислительной медициной. В качестве главы отдела защиты разработчиков в Grid.ai он сотрудничает с сообществом машинного обучения, чтобы решать реальные проблемы с помощью технологий, меняющих правила игры, которые затем документируются, публикуются в открытом доступе и передаются остальному миру.