Google: наш помощник откроет новую эру искусственного интеллекта

Ученые компании считают, что ее новый информационный бюллетень, основанный на искусственном интеллекте, станет самым большим событием со времен поиска. Добро пожаловать в Переход.

Это на следующий день после крупного мероприятия, посвященного оборудованию Google в Сан-Франциско, когда компания официально представила новый телефон (удар по iPhone) и динамик с голосовым управлением (удар живота для Эхо Амазонки). Сарафанное радио уже отслеживает положительные результаты; обратный отсчет до экстази в виде грядущих восторженных обзоров телефона Pixel уже начался. Но в конференц-зале обширного кампуса компании в Маунтин-Вью Фернандо Перейра, возглавляющий проекты Google в области понимания естественного языка, не так рад новым блестящим устройствам своей компании, как тем, что произойдет, когда люди будут ими пользоваться.

«Позвольте мне рассказать вам немного о The Transition», - говорит он.

Перейра имеет звание выдающегося ученого Google. С момента прихода в компанию в 2008 году с должности главы факультета компьютерных и информационных наук Пенсильванского университета он был в центре усилий Google, направленных на поиск ответа на вопрос: Как мы узнаем значение текста из данных? Другими словами, как машина может по-настоящему понять фразы, которые люди клюют и произносят в ее поисковые поля и микрофон? Исследователи из Google и других компаний нашли ответ на этот вопрос: машинное обучение; в частности, форма искусственного интеллекта, называемая нейронными сетями, - самоорганизующиеся системы, смоделированные по принципу работы мозга. Эти системы используют сложные алгоритмы и массу данных для самообучения. Чем больше данных, тем лучше.

Как объясняет Перейра, The Transition - это щедрость данных на уровне вакансий, которую его команда и другие ученые в Google получат, когда миллионы людей начнут общаться с ведущим ботом его компании, Google Assistant. Помощник - это единая программная система, которая будет реализована на нескольких платформах Google, включая телефон Pixel и устройство Google Home. Он стремится управлять функциями телефона, как это делает Siri, предоставлять услуги так же легко, как Amazon Alexa, и вести беседу на уровне гейш, которая опозорит бизнес-бота в Messenger Facebook.

Хотя Google уже интерпретирует голосовые команды в таких продуктах, как голосовой поиск в приложении Google, Ассистент отличается: Google видит в нем апофеоз своих усилий по ответу на вопросы и выполнению функций. Компания рассматривает Ассистента как эволюцию многих продуктов, включая Поиск, Карты, Фото и Google Now. Примеры запросов, которые предлагает компания, показывают предполагаемый объем продукта: Покажи мне фотографии пляжа. Включите танцевальную музыку по телевизору. Расскажи мне о моем дне. Ассистент оптимизирован для выполнения большей части своей работы через устный обмен человеком и машиной. После того, как он ответит на вопрос Где ближайший итальянский ресторан?, вы можете указать ему Перейти туда, и вы получите направление.

Каким бы хорошим ни был Google Assistant, Перейра знает его недостатки. Больше всего разочаровывает то, что способность Ассистента понимать сложные запросы и обсуждать их - это только начало долгого пути, который предвидит Google. Слишком легко наткнуться на стену, где Ассистент просто не понимает, что вы говорите. Перейре нужен помощник, чтобы действительно, действительно понимать, что говорят люди, таким образом, чтобы отразить мастерство в тонкостях общения с общим пониманием того, как работает физический мир.

Это сложно, особенно потому, что у Google еще не было данных для обучения своих нейронных сетей до тех уровней, которых он стремится достичь. «Когда вы пытаетесь построить систему для понимания естественного языка и у вас не так много примеров того типа понимания, который вам нужен, - говорит Перейра, - тогда вы должны предписывать, вы должны писать - по сути, учите его грамматике - чтобы он мог понять. Это учение очень трудоемкое ».

Но Перейра считает этот момент переломным моментом. Google Assistant, получивший более чем десятилетний опыт компании, достаточно хорош, чтобы удержать тех пользователей, которые пробуют его. Он считает, что то, что эти постоянные клиенты скажут Ассистенту, и их реакция на его действия, помогут сделать Google Ассистент отличным.

Этот процесс, который развернется в течение следующих двух лет, и есть Переход. Когда миллионы людей начинают общаться с Google через Ассистента, море трудностей внезапно расходится. (В Google Home общение - это единственный способ получить от него хоть какую-то пользу - здесь нет клавиатуры.) «Вы можете начать заниматься машинным обучением, - говорит Перейра. «Вы можете двигаться намного быстрее; вы можете ускорить процесс углубления и расширения понимания. Этот переход с 2016 на 2017 год уведет нас от систем, которые обучаются явным образом, к системам, которые обучаются неявно ». Думайте об этом как о мини-сингулярности.

Данные, поступающие в течение этого двухлетнего переходного периода, конечно же, не прекратятся. (Я должен уточнить здесь, что Перейра и другие гуглеры, говорящие об этом переходе, имеют в виду сбор данных в совокупности, а не накопление досье по разговорным предпочтениям, странствиям и грешкам отдельных пользователей.) Перейра считает, что это ведет к лучшая версия Ассистента, что, в свою очередь, приведет к большему количеству пользователей, большему количеству разговоров, большему количеству данных и большему количеству улучшений. Возможно, через десять лет этот ускоряющийся цикл может привести к появлению бота, который действительно знает, о чем мы говорим, когда говорим ... о чем угодно.

«Запуск Ассистента очень похож на запуск поиска Google в самом начале своей компании», - говорит Перейра. «Тогда поиск был прекрасным занятием, но по сравнению с тем, что он есть сегодня, понимания гораздо больше. Мы увидим это с помощью Ассистента через 10 лет по сравнению с сегодняшним Ассистентом. Он будет более беглым, более способным помочь вам делать то, что вы хотите, лучше понимать контекст разговора, иметь больше возможностей объединять информацию из разных источников ».

Для этого есть прецедент. В 2007 году Google запустил службу под названием 1–800-GOOG-411. Во времена стимпанка, когда телефон набирал номер, вращение цифр 411 свяжет вас с сервисом под названием «Информация» (название сейчас кажется странным), где оператор-человек будет слушать, как вы произносите имя и местонахождение человека или компании. ты хотел позвонить. Затем он или она даст вам номер телефона. В какой-то момент телефонные компании начали взимать плату за услуги.

Но Google предложил бесплатную автоматизированную альтернативу, которая принимает ваш голосовой запрос и мгновенно связывает вас с запрашиваемым вами бизнесом. Дело не в том, чтобы завоевать друзей или даже расширить поиск. Google собирался собрать огромную базу данных произнесенных слов, которую можно было оцифровать и проанализировать. Как тогда объяснила Марисса Майер, тогдашний вице-президент Google, эксперты по распознаванию речи, которые у нас есть, говорят:« Если вы хотите, чтобы мы построили действительно надежную речевую модель, нам нужно много фонем, то есть слога. как произносится определенным голосом с определенной интонацией ... 1–800-GOOG-411 об этом: получение набора различных речевых образцов, чтобы, когда ... мы пытаемся получить голос из видео [или других задач требуется распознавание голоса], мы можем сделать это с высокой точностью .

Спустя три года у Google был достаточный запас фонем, чтобы он мог начать делать такие вещи, как голосовой диктант. Таким образом, он прекратил обслуживание. Переход будет иметь аналогичную цель: сбор многих миллионов (если не миллиардов) запросов к Google Ассистенту в разных сценариях - на ходу с телефоном; дома с Google Home - чтобы компания могла обучить свои нейронные сети глубокого обучения, чтобы они хорошо понимали, как создать бота, который знает, о чем вы просите, и который может разговаривать с вами, пока ваш запрос не будет удовлетворен.

Google нуждается в этом, несмотря на 18 лет сбора данных из полей поиска. Во-первых, люди не взаимодействуют с поиском в диалоговом режиме. «Люди возлагают большие надежды на поиск», - говорит Скотт Хаффман, вице-президент Google. «Типа, О, вот эта рамка. Я должен вставить 2,5 слова и собираюсь вернуть общедоступную информацию. Скажите людям, что они могут сказать этому ящику: Позвони моей возлюбленной, и они скажут: Что? Я бы никогда не сказал это этому ящику! ». Но они, скорее всего, сделают это для Ассистента, который теперь с помощью машинного обучения понимает, как определить, что такое« возлюбленный »и как идентифицировать этого человека. по частоте звонков к нему и другим данным.

Другая важная информация появится, когда люди попросят Ассистента выполнить за них действия. «В журналах поиска мы не видим людей, просящих сделать что-то вроде: Закажи мне столик в CasCal на 7 часов вечера на двоих. Никто не скажет этого Google, потому что Google - это поисковая система, верно? " - говорит Перейра. На самом деле бронирование столика - это то, что может сделать Google Search, но это редкое исключение: как правило, поиск Google может дать вам ответы, но не может закрыть сделку. Таким образом, люди не просят его о каких-либо действиях, а Google не получает данных о помощи. «Эта разница между знанием и делом велика, - говорит Перейра, - и только сейчас мы начинаем получать достаточно трафика и взаимодействия, чтобы начать понимать, как мы можем заставить [помощника] расти и стать более надежным, более универсальным, более гибкий. Нам предстоит долгий путь от информационной стороны, откуда исходит поиск, к практической стороне - к всесторонней помощи ».

Google Ассистент впервые появился в сентябре как функция в фирменном приложении для обмена сообщениями под названием Allo; только сейчас телефон Pixel пользуется успехом. (Google Home выходит 4 ноября.) Критики сообщают, что Google Assistant понимает запросы и выполняет задачи лучше, чем Siri от Apple. Его кратковременная память позволяет ему сохранять информацию, так что, когда вы запрашиваете близлежащие фильмы, вы можете заказать один с ним, сказав: Купи мне билеты на показ Бухгалтера в 16:00, и он Буду знать, о каком театре вы говорите. Но нетрудно сделать разумный запрос, разоблачающий поверхностность понимания мира Ассистентом.

Хаффман, давний руководитель поисковой системы, который сейчас курирует разработку Ассистента, приводит пример. Прямо сейчас Google Assistant оправдает ожидания, если вы попросите его забронировать столик в мексиканском ресторане рядом с вами. Но если вы попросите столик в одном из моих обычных мест, вы едете на машине Тельма и Луиза в Застрявшую долину.

«Извините, - скажет он, - я ничего не могу с этим поделать».

Вы сочтете это неудачей. Но Google видит в этом возможность. Это часть Перехода. Эти слова уступки, по сути, являются предупреждением для компьютерных ученых в Маунтин-Вью. Каждый раз, когда Google Assistant извиняется, это показатель того, что что-то может быть улучшено, и если на основе похожих запросов их накопится достаточно, то команда, вероятно, что-то с этим предпримет. В случае запроса «обычных мест» эти сбои могут побудить инженеров улучшить Ассистента, чтобы он понимал эту концепцию, мощность, еще не встроенную в искусственные нейроны его сети.

Как это сделать? «Мы можем посмотреть на распределение мест, которые люди хотят посетить, и придумать некий набор фильтров или ограничений о том, как мы должны определять, что означает« обычное », - говорит Хаффман. Затем инженеры могут составить правило для проверки - например, что «обычное» может означать место в пределах 10 минут езды, которое вы посетили три раза за последние шесть месяцев. «Почти не имеет значения, что это такое - просто придумайте какое-нибудь правило», - говорит Хаффман. «После этого начинается машинное обучение. Поэтому, когда вы говорите: Забронируйте обычное место, тогда как раньше мы не могли вам помочь, теперь мы говорим: О, вы хотите пойти в закусочную Джо на Третьей улице? Если они пойдут, Нет, я ненавижу закусочную Джо, я не был там полгода - я хочу пойти в закусочную Сьюзи, отлично! Затем вы можете приступить к разработке модели, полностью основанной на машинном обучении ».

Перейра говорит, что, как только это произойдет, нейронные сети Google смогут совершить скачок в понимании, чтобы они могли добывать существующую базу знаний компании (обширное хранилище информации с более чем 70 миллиардами фактов), а также неструктурированные данные в Интернете - в одном более целостным образом, интерпретируя реальное значение всех этих мест и вещей. Таким образом, он мог использовать информацию из широкого спектра источников для выполнения одной сложной задачи.

Один из примеров, используемых внутри компании Google, - это процесс замены вышедшего из строя водонагревателя. Чтобы это сделать, необходимо выяснить, какой водонагреватель подходит для дома, оценить его, получить данные о потребителях лучших брендов, совершить покупку, связаться с установщиком и договориться о взаимоприемлемой встрече для установки. Прямо сейчас эта задача требует объединения разрозненных фрагментов информации с использованием здравого смысла, знаний и, возможно, нескольких онлайн-каталогов. Google мечтает, что однажды, сразу после того, как вы закончите устранять повреждения от перегоревшего водонагревателя, вы скажете «Окей, Google» своему домашнему устройству, проведете короткий, но целеустремленный разговор с этим маленьким коротеньким динамиком, а затем сядете поудобнее и дождитесь приезда установщика. «Вся необходимая для этого информация находится где-то в каком-то компьютерном файле», - говорит Перейра. «Информация обо всех водонагревателях, БТЕ, график установщика, все. Но мы вообще не можем этого сделать. Это Святой Грааль. Вот, куда мы хотим пойти. Но уж точно не там, где мы находимся ».

Ничего из этого не произойдет, если люди не найдут Google Ассистента достаточно увлекательным, чтобы продолжать с ним разговаривать, предоставляя Google данные, которые будут способствовать его совершенствованию. Если люди используют Ассистента ограниченным образом и не расширяют его границы, The Transition потерпит неудачу. «Честно говоря, задача для нас будет заключаться в том, чтобы иметь достаточно разговорных способностей - а мы думаем, что мы это делаем, - чтобы убедить людей продолжать это делать», - говорит Хаффман. «Очевидно, что мы не идеальны, но если у нас будет достаточно средств, чтобы люди продолжали стараться, это даст нам основу для того, чтобы комбинат действительно справился с этой задачей».

Переход ждет своего часа. Но сначала люди должны начать говорить: «Окей, Google». И продолжай говорить.

Художественный руководитель Redindhi Studio
Портреты Фернандо Перейры Талии Херман

Google: наш помощник откроет новую эру искусственного интеллекта

Похожие вопросы