Машины далеки от надежного решения задач управления восприятием в открытом мире, таких как воздушная навигация с видом от первого лица (FPV). Хотя недавние достижения в сквозном машинном обучении, особенно в имитационном обучении и обучении с подкреплением, кажутся многообещающими, они сдерживаются необходимостью большого количества сложных для сбора помеченных данных реального мира. С другой стороны, смоделированные данные легко генерировать, но, как правило, они не обеспечивают безопасного поведения в различных сценариях реальной жизни. В этой работе мы предлагаем новый метод изучения надежных зрительно-моторных политик для развертывания в реальном мире, который можно обучать исключительно с помощью смоделированных данных. Мы разрабатываем расширенные представления состояний, которые объединяют контролируемые и неконтролируемые данные среды. Наш подход использует кросс-модальную перспективу, где отдельные модальности соответствуют необработанным данным камеры и состояниям системы, имеющим отношение к задаче, например относительное положение ворот по отношению к дрону в случае гонки дронов. Мы передаем обе модальности данных в новую факторизованную архитектуру, которая изучает совместное низкоразмерное встраивание с помощью вариационных автокодировщиков. Затем это компактное представление вводится в политику управления, которую мы обучали с помощью имитационного обучения с экспертными траекториями в симуляторе. Мы анализируем богатые скрытые пространства, полученные с помощью наших предложенных представлений, и показываем, что использование нашей кросс-модальной архитектуры значительно повышает эффективность политики управления по сравнению со сквозным обучением или извлечением признаков без учителя. Мы также представляем реальные результаты навигации дронов через ворота в различных конфигурациях дорожек и в различных условиях окружающей среды. Предлагаемый нами метод, который полностью работает на борту, может успешно обобщать изученные представления и политики в моделировании и реальности, значительно превосходя базовые подходы.

Загрузка публикации

Имитация AirSim Drone Racing VAE

17 марта 2020 г.

Этот репозиторий предоставляет кодовую базу для оценки и обучения моделей из статьи «Изучение зрительно-моторных политик для воздушной навигации с использованием кросс-модальных представлений».

ссылка: https://github.com/microsoft/AirSim-Drone-Racing-VAE-Imitation