4 аудио примера сообщества PyTorch Lightning, которые вдохновят ваш следующий проект!

TL; DR PyTorch Lightning используется некоторыми довольно интересными проектами сообщества, чтобы делать больше с ИИ. В этой серии статей я расскажу о некоторых из моих любимых проектов сообщества, которые вдохновляют меня делать больше с ИИ.

PyTorch Lighting - это легкая оболочка PyTorch для высокопроизводительных исследований искусственного интеллекта. PyTorch Lightning обеспечивает истинную гибкость за счет сокращения количества инженерных шаблонов и ресурсов, необходимых для реализации современного искусственного интеллекта. Организация кода PyTorch с помощью Lightning обеспечивает беспрепятственное обучение на нескольких графических процессорах, TPU, CPU и использование сложных для реализации передовых методов, таких как сегментирование модели и даже с 16-битной точностью без изменения кода.

1. NVIDIA NeMo

NeMo - это набор инструментов, который позволяет создавать сложные нейронные архитектуры для разговорного ИИ с использованием многоразовых нейронных модулей. Нейронные модули обычно представляют уровни данных, кодировщики, декодеры, языковые модели, функции потерь или методы комбинирования активаций. Инструментарий поставляется с расширяемыми коллекциями предварительно созданных модулей и готовых к использованию моделей для:

Используя PyTorch Lightning, NeMo может масштабировать обучение на несколько графических процессоров и несколько узлов.

NVIDIA / NeMo
NeMo - это набор инструментов для создания диалоговых приложений AI. Инструментарий NeMo позволяет исследователям легко… github.com

2. Астероид

Asteroid - это набор инструментов для разделения источников звука, который позволяет быстро экспериментировать с общими наборами аудиоданных. Он поддерживает широкий спектр наборов данных и архитектур, а также набор рецептов для воспроизведения некоторых важных документов, включая ConvTasnet (Луо и др.), Таснет (Луо и др.), Глубокую кластеризацию ( Hershey et al. И Isik et al.), Chimera ++ (Luo et al. И Wang et al.), DualPathRNN (Luo et al.), Two пошаговое обучение ( Цинис и др. ) и др.

Команда астероидов / астероид
Asteroid - это основанный на Pytorch набор инструментов для разделения источников звука, который позволяет быстро экспериментировать с общими наборами данных. Это… github.com

3. Классификация городского шума: стремление к справедливому сравнению

Набор данных UrbanSound 8k содержит 8732 помеченных звуковых отрывка (‹= 4 с) городских звуков из 10 классов: air_conditioner, car_horn, children_playing, dog_bark, Drilling, enginge_idling, gun_shot, jackhammer, siren и street_music.

Классы взяты из городской звуковой таксономии. Все выдержки взяты из полевых записей, загруженных на www.freesound.org.

Это репо содержит код для статьи: Классификация городского шума: стремление к справедливому сравнению. Он представляет собой отличный пример того, как Lightning можно использовать для создания справедливого сравнения различных моделей, используя одно и то же входное представление, метрики и оптимизатор для оценки производительности.

multitel-ai / urban-sound-классификация-и-сравнение
Это репо содержит код для нашей статьи: Классификация городского звука: стремление к честному сравнению. Он предоставляет… github.com

4. Педальная сетка

Это воссоздание PyTorch Lightning модели из Эмуляции гитарного усилителя в реальном времени с глубоким обучением, созданной нашим Grid.ai Тедди Кокером. Это действительно крутой пример того, как использовать Lightning для имитации эффектов педалей устройств, которые изменяют звучание электрогитар.

teddykoker / pedalnet
Воссоздание модели из эмуляции гитарного усилителя в реальном времени с глубоким обучением Подробнее см. В моем сообщении в блоге… github.com

Вдобавок у Тедди есть действительно крутая запись в блоге на эту тему, и он является повсюду рок-звездой, обязательно ознакомьтесь с ней!

Глубокое обучение для эмуляции гитарных эффектов
С 1940-х годов электрогитаристы, клавишники и другие инструменталисты использовали педали эффектов, устройства… teddykoker.com

Вот и все, четыре потрясающих проекта Audio PyTorch Lightning, которыми можно вдохновиться. Если вы считаете, что я пропустил интересный комментарий к проекту PyTorch Lightning Audio ниже, я его проверю!

Следующие шаги

Пока вы здесь, если вы когда-либо хотели масштабировать свое обучение PyTorch Lightning со своего ноутбука в облако, не меняя ни одной строчки кода, обязательно ознакомьтесь с grid.ai, который в настоящее время находится в закрытом предварительном просмотре. Вы можете зарегистрироваться в листе ожидания по ссылке ниже.

Форма MC при регистрации
Изменить описание www.grid.ai

Мы также всегда ищем более талантливых людей, чтобы присоединиться к команде Lightning. Лучший способ привлечь внимание - это внести свой вклад и отправить свое резюме по электронной почте на адрес [email protected]!

об авторе

Аарон (Ари) Борнштейн - исследователь искусственного интеллекта, увлеченный историей, занимающийся новыми технологиями и вычислительной медициной. В качестве главы отдела защиты разработчиков в Grid.ai он сотрудничает с сообществом машинного обучения, чтобы решать реальные проблемы с помощью технологий, меняющих правила игры, которые затем документируются, публикуются в открытом доступе и передаются остальному миру.