Почему Tesla, а не Waymo, является лидером в разработке самоуправляемых автомобилей

Отвечая на популярные аргументы о лидаре, отключениях, таланте ИИ и т. Д.

Нейронные сети необходимы для решения проблем, которые должен решать беспилотный автомобиль: компьютерное зрение, прогнозирование поведения участников дорожного движения, а также планирование и выполнение задач вождения. Чем больше обучающих данных, тем лучше работают нейронные сети. Среди производителей беспилотных автомобилей только Tesla может обучать нейронные сети в масштабе миллиардов миль. Ни одна другая компания не может сравниться с этим. Таким образом, само собой разумеется, что Tesla добьется большего прогресса в области беспилотных автомобилей, чем любая другая компания.

Когда я выдвигаю этот аргумент, в ответ я слышу множество контраргументов о Waymo. Наиболее частые аргументы, которые я слышу:

  • «Беспилотным автомобилям нужен лидар».
  • «Waymo на годы опережает Tesla».
  • «Google и DeepMind - мировые лидеры в области машинного обучения, поэтому Waymo - лидер в области беспилотных автомобилей».
  • «У Waymo самый низкий уровень увольнений водителями безопасности».
  • «У Waymo уже есть служба беспилотных такси».

Присмотритесь к этим аргументам поближе, и я думаю, вы найдете веские причины сомневаться в них.

«Беспилотным автомобилям нужен лидар».

Краткий ответ: Есть много важных вещей, которые невидимы для лидара и видны только камерам. С лидаром или без него компьютерное зрение на основе камеры должно быть отличным. Если все в порядке, то лидар может и не понадобиться. Лучший способ добиться успеха - отказаться от лидаров и вместо этого перейти к масштабированию обучающих данных.

Длительный отклик. Лидар измеряет глубину, и многие важные особенности дорожной обстановки не имеют глубины. Некоторые из них основаны на краске: полосы движения, стоп-линии, стрелки поворота и пешеходные переходы. Другие - световые сигналы: стоп-сигналы, указатели поворота, аварийные огни и светофоры. Наконец, есть признаки. Чтобы ездить безопасно и хорошо, беспилотный автомобиль должен с высокой точностью распознавать все эти особенности. Их видят только камеры.

Если компьютерное зрение с помощью камеры недостаточно точно при распознавании объектов без глубины, лидар не поможет. Если он достаточно точен, то это ставит под сомнение необходимость лидара. Если одни камеры достаточно хороши для распознавания вещей без глубины, что может помешать камерам также быть достаточно хорошими в распознавании вещей с глубиной?

Разрешение лидара также слишком низкое, чтобы видеть мелкие детали, такие как выражения лиц пешеходов или их более тонкие формы языка тела. Камеры могут улавливать эти визуальные сигналы, которые нейронные сети могут использовать для прогнозирования движений пешеходов. Небольшие препятствия, такие как пластиковые пакеты (безопасные) и шлакоблоки (опасные), также могут быть неотличимы для лидара.

Использование лидара не исключает использования камер, но при нынешних ценах на лидары это не препятствует масштабному использованию камер. В конце концов, у нас будет доступный лидар, но в конечном итоге не сегодня, и сегодня, если вы хотите поставить на дорогу миллион автомобилей с камерами, вы также не можете оборудовать эти автомобили лидаром. (По крайней мере, не тот высококачественный лидар, который использует Waymo.) Наличие миллиона автомобилей на дороге помогает решить проблемы со зрением на основе камеры за счет увеличения объема обучающих данных . Как только вы их решите проблемы, вам не нужен лидар. Если вы их не решили, лидар не поможет. Итак, почему бы не увеличить свои шансы на решение проблемы зрения на основе камеры?

«Waymo на годы опережает Tesla».

Краткий ответ: Временной разрыв не так велик, как может показаться на первый взгляд, потому что Waymo (по-видимому) начал использовать глубокие нейронные сети только в 2015 году.

Длинный ответ. Глубокие нейронные сети - это основополагающая технология для беспилотных автомобилей. Без них беспилотные автомобили, скорее всего, были бы невозможны. (Даже с ними они могут оказаться невозможными. Мы увидим.) Waymo была создана в 2009 году, за несколько лет до того, как глубокие нейронные сети стали популярны в сообществе исследователей ИИ. В альтернативной истории, когда глубокие нейронные сети не получили широкого распространения, вполне возможно, что Waymo никогда бы не закончил «фабрику лунных выстрелов» Google.

Waymo впервые попробовала применить глубокие нейронные сети для обнаружения пешеходов в 2015 году. Первая система на основе глубоких нейронных сетей работала в 100 раз лучше, чем ее предыдущая система. Превосходство компьютерного зрения над человеческим зрением и так является открытой задачей. Со старыми техниками, которые работали в 100 раз хуже, это не кажется решаемой проблемой.

Tesla начала применять глубокие нейронные сети для решения задач компьютерного зрения не позднее 2016 года. В 2017 году Tesla развернула второе поколение автопилота, в котором используются нейронные сети компьютерного зрения Tesla. Основываясь на этой информации, Waymo сможет начать применять глубокие нейронные сети к автономному вождению максимум через один год, а возможно, и через ноль лет. У Waymo нет семилетнего старта, который может показаться его основанием.

Когда дело доходит до применения глубоких нейронных сетей к фактическим действиям при вождении, в отличие от компьютерного зрения, эта работа даже более поздняя, ​​чем работа над компьютерным зрением. DeepMind популяризировал глубокое обучение с подкреплением в 2013 году, продемонстрировав его эффективность в играх Atari. Точно так же, как ранние системы компьютерного зрения Waymo, вероятно, никогда не работали бы должным образом, я лично подозреваю, что большую часть ранних работ по программированию управляющих действий вручную придется в конечном итоге отбросить в пользу подхода, основанного на нейронных сетях. Исследователи и инженеры, работающие над беспилотными автомобилями, похоже, все больше склоняются к таким идеям, как глубокое обучение с подкреплением и глубокое имитационное обучение.

«Google и DeepMind - мировые лидеры в области машинного обучения, поэтому Waymo - лидер в производстве беспилотных автомобилей».

Краткий ответ: Чтобы Waymo могла разрабатывать беспилотные автомобили в небольших масштабах, исследователям машинного обучения, возможно, потребуется совершить новый фундаментальный прорыв. Напротив, подход Tesla заключается в простом расширении существующих подходов, которые оказались успешными в других приложениях.

Длинный ответ: золотой призер Олимпийских игр лучше, чем бронзовый призер или человек, занявший пятое место. Но это лишь постепенные различия. Заставьте Усейна Болта носить утяжелители для лодыжек, и другие бегуны проплывут мимо него. Быть лучше достаточно для победы только в том случае, если конкуренция будет честной.

Конкуренция между Waymo и Tesla несправедлива. Waymo пытается решить проблемы машинного обучения с ограниченными данными, а Tesla пытается решить те же проблемы с большим количеством данных. Решение проблем с большим объемом данных - это метод работы современного машинного обучения. Решение проблем с ограниченными данными - это открытая исследовательская проблема. Если бы Google или DeepMind смогли совершить необходимый прорыв, чтобы получить такую ​​же производительность нейронной сети из скудных данных Waymo, как и из обширных данных Tesla, последствия вышли бы за рамки самоуправляемых автомобилей, робототехники в целом и других приложений машинного обучения. Это было бы большим делом, и мы бы это увидели.

Поскольку парк Tesla проезжает примерно в 400 раз больше миль в месяц, чем парк Waymo, парк Tesla может сталкиваться с ситуацией 1200 раз в год, с которой парк Waymo встречается только три раза. Исследователи работают над такими подходами, как однократное имитационное обучение, которые могут позволить беспилотному автомобилю учиться на одном примере ситуации или на нескольких примерах. На данный момент это все еще нерешенная проблема. С другой стороны, у нас уже есть доказательства концепции, такие как AlphaStar от DeepMind, которые показывают, что искусственный агент может овладевать сложным поведением посредством имитационного обучения и обучения с подкреплением, если агент тренируется на огромном количестве человеческих демонстраций и огромном количестве проб и ошибок. . Обучение на больших данных работает сегодня. Обучение мелкомасштабным данным может сработать завтра.

Остается открытым вопрос, будет ли любой объем сбора данных - даже с использованием каждого автомобиля на Земле - достаточным для решения проблемы автономного вождения с использованием существующих методов. Если масштаба Waymo недостаточно, чтобы решить эту проблему, то и Tesla тоже. Итак, зачем вообще проводить различие между Waymo и Tesla?

У нас нет веских доказательств, но у нас есть подсказка. Мы можем сравнить масштаб данных, используемых для решения StarCraft, и заметить, что парк Tesla находится примерно на одном уровне. AlphaStar тренировалась на протяжении десятков тысяч лет непрерывной игры; Автопарк Tesla будет непрерывно ездить в течение десятков тысяч лет каждый год. DeepMind обучил 300 версий AlphaStar по 200 лет каждая, всего 60 000 лет. У Tesla есть 500 000 автомобилей, управляющих один час в день, что составляет 20 000 лет в год. Парк Waymo, напротив, работает менее 500 лет в год, а за всю свою историю - менее 500 лет.

«У Waymo самый низкий уровень увольнений водителями безопасности».

Краткий ответ: Показатель разъединения, сообщаемый в Управление по связям с общественностью Калифорнии, не является общим показателем разъединения. У нас также нет данных Tesla, с которыми можно было бы провести сравнение.

Длинный ответ: Рид Бир, бета-тестер Waymo, говорит, что водитель, отвечающий за безопасность человека, берет на себя управление примерно раз в пять поездок. Если в среднем продолжительность поездки составляет 8 миль, то это разъединение происходит примерно каждые 40 миль. Это далеко от показателя одного выхода из боя на 11 000 миль, о котором сообщалось в Калифорнийское DMV. Что дает?

DMV Калифорнии не запрашивает полную скорость размежевания. Он запрашивает только отключения, связанные с безопасностью: случаи, когда столкновение могло произойти, если бы водитель безопасности не вмешался. По-видимому, отключение, связанное с безопасностью, составляет крошечный процент от общего числа отключений.

Сотрудники должны оценить, было ли отключение связано с безопасностью, и это отчасти является субъективным суждением. Например, Круз решил, что проезд на красный свет не является причиной вмешательства с точки зрения безопасности.

Tesla не делает того, что Калифорнийское DMV считает полностью автономными испытаниями на дорогах общего пользования в Калифорнии, поэтому не сообщает никаких цифр в Калифорнийское DMV. Таким образом, невозможно сравнить показатели отключения, связанные с безопасностью, Waymo и Tesla (даже если бы мы могли гарантировать, что сотрудники одинаково оценивают то, что связано с безопасностью).

«У Waymo уже есть служба беспилотных такси».

Краткий ответ: использование бета-тестеров для тест-драйва само по себе не является признаком технических возможностей, и не способствует техническому прогрессу.

Длинный ответ. Любая компания, которая тестирует прототипы беспилотных автомобилей на дорогах общего пользования, может отодвинуть на задний план людей, не являющихся сотрудниками. Но почему? Это увеличивает ответственность, неудобства и расходы и никоим образом не помогает беспилотному автомобилю научиться лучше видеть, лучше прогнозировать поведение участников дорожного движения или принимать более обоснованные решения при вождении. В течение ограниченного времени Uber брал некоторых питтсбургских пассажиров для поездок на своих прототипах автомобилей. Многие компании время от времени проводят тестовые поездки на задних сиденьях, не являющихся сотрудниками. Waymo просто устраивает самые масштабные тестовые поездки; это не обязательно означает, что технология Waymo является лучшей.