Журналист: Тони Пэн | Редактор: Майкл Саразен

Google MusicVAE - это машинное обучение Моцарта

Подпишитесь «здесь», чтобы получать подробные технические новости, обзоры и аналитику!

Google объявила о выпуске MusicVAE, модели машинного обучения, которая позволяет создавать музыку так же просто, как смешивать краски на палитре. MusicVAE - это прорыв в рамках проекта Magenta от Google Brain, который генерирует и трансформирует мелодии для вывода мульти-инструментальных пассажей, оптимизированных для экспрессии, реализма и плавности, которые убедительно напоминают музыку, сочиненную человеком.

В то время как прорывы в технологиях искусственного интеллекта, таким образом, сделали. Magenta, как правило, возникла в результате исследования отраслевых решений, но изучает потенциал ИИ в творческих сферах, которые отличают людей от машин. Запущенная в 2016 году, Magenta использует алгоритмы глубокого обучения и обучения с подкреплением для изучения искусства и музыки и представила ряд исследовательских инструментов, в том числе NSynth, музыкальный синтезатор; и SketchRNN, интерактивный эксперимент по рисованию на основе нейронной сети.

Нелегко научить машину создавать стандартизированный метод смешивания различных музыкальных элементов. Исследователи Google обратились к Variational Auto-Encoders (VAE), широко используемой генеративной модели, которая с 2013 года дает самые современные результаты машинного обучения для создания изображений и обучения с подкреплением.

VAE работают. в структуре кодер-декодер, где кодер представляет вариацию в наборе данных большой размерности с кодом меньшей размерности, а декодер трансформирует вариацию в нейронной сети для создания выходных данных. Модель может быть уточнена и настроена путем сравнения входных и выходных данных.

Исследователи Google уже применили эту технику к SketchRNN, а теперь добавили такую ​​же инфраструктуру в MusicVAE. Поскольку музыкальные элементы обычно сложнее эскизов, исследователи Google разработали новый иерархический декодер для MusicVAE, способный генерировать долговременную структуру из отдельных скрытых кодов.

В прошлый четверг Google выпустила реализацию Tensorflow. MusicVAE и библиотеки JavaScript с предварительно обученными моделями MusicVAE, чтобы помочь кодерам, композиторам и исследователям создавать инструменты.

Несколько инженеров Google уже вручную создали приложения на основе MusicVAE. Melody Mixer - это интерфейс, созданный Creative Lab Google, который позволяет пользователям генерировать интерполяцию между короткими петлями мелодии. Latent Loops от Google Pie Shop может создавать палитру мелодических петель, делая наброски на матрице.

Демо-версии и образцы музыки, созданные MusicVAE, уже появляются в социальных сетях. Эта штука с MusicVAE до абсурда крута. Интерполированные (и генерируемые случайным образом) мелодии / песни звучат * реально *, как будто они были составлены, а не сгенерированы , - написал в Твиттере Александр Хут, доцент кафедры компьютерных наук и нейробиологии в UT Austin.

Команда Magenta подчеркивает, что MusicVAE и другие их интеллектуальные инструменты предназначены для совместной работы, чтобы позволить артистам и музыкантам расширять (а не заменять!) свои процессы.