Революция пользовательского опыта с помощью машинного обучения

Везде, кроме Пользователя

В последнее время много написано о машинном обучении и искусственном интеллекте. Практически во всех отраслях невозможно открыть публикацию, не прочитав о том, как искусственный интеллект может преобразовать и сделать организации более продуктивными.

Этот акцент на трансформирующей силе ИИ также породил опасения, что рабочие места - как второстепенные, так и высококвалифицированные - будут заменены. Я считаю, что успешный ИИ дает нам дополнительные инструменты. Инструменты, которые можно использовать с огромным успехом множеством способов, обогащая нашу жизнь и делая наши занятия более интересными.

Об автоматизации много говорят о неквалифицированной рабочей силе, однако автоматизация также заменяет высококвалифицированную рабочую силу. От JP Morgan Chase and Co, использующего машинное обучение для анализа финансовых сделок, которое раньше занимало юридические группы тысячи часов, до автоматизации 2500 киосков McDonald's, до исследования Стэнфорда и стартапа iRhythmTech, показывающего, что ИИ может использоваться для выявления проблем с сердцем более эффективно, чем обученные врачи, примеры повышения эффективности ИИ можно найти повсюду.

Здравоохранение - это одна из областей, в которой потенциальные приложения ИИ могут значительно улучшить как рабочие процессы практикующих врачей, так и результаты лечения пациентов. Google обучил систему искусственного интеллекта определять опухоли на изображениях потенциально раковых грудей, и утверждает, что точность составляет 89% по сравнению с 73% для патологов-людей.

С этим связан тель-авивский стартап Zebra Medical, который утверждает, что может использовать AI для обнаружения некоторых типов раковых клеток с точностью 91% по сравнению с 88% для квалифицированного радиолога. Основатель Элад Бенджамин говорит: Через пять или семь лет у радиологов…… будут аналитические механизмы или боты, подобные нашему, которые будут выполнять 60, 70, 80 процентов своей работы.

Это увлекательно, но зияющая дыра в этом покрытии - это пользовательский опыт. Это важно, учитывая, что мы стали полагаться на удобство использования мобильных устройств в большинстве аспектов нашей жизни. От проверки погоды до заказа продуктов с помощью голосового помощника и потоковой передачи подкастов с нашей интеллектуальной приборной панели автомобиля.

Что эта революция искусственного интеллекта будет означать для конечного пользователя? Далее я представлю несколько примеров того, как машинное обучение может быть использовано для создания богатого пользовательского опыта, который представляет большую ценность для пользователей.

Но прежде чем мы перейдем к этому, почему все это происходит сейчас?

Почему сейчас?

AI не новинка. Это поле существует с 1950-х годов. Машинное обучение или машинное обучение - это новейший и лучший подход к искусственному интеллекту. ML - это то место, где система учится сама по себе, а не получает явные, созданные вручную правила.

Мы были окружены системами, которые полагаются на машинное обучение уже несколько десятилетий, но большинство из нас не знали. Они существуют, среди прочего, в таких приложениях, как фильтры спама, поисковые системы и системы распознавания символов.

ML начало привлекать к себе всеобщее внимание около пяти лет назад с потрясающими результатами, достигнутыми с помощью техники, называемой глубоким обучением, во многом благодаря результатам проекта Google Brain.

С тех пор глубокое обучение - тип искусственной нейронной сети - и рекуррентные нейронные сети продолжали уничтожать предыдущие рекорды производительности в самых разных задачах - от подписи изображений до распознавания речи, распознавания рукописного ввода и перевода на естественный язык.

Обучение с подкреплением (RL), методика, с помощью которой боты учатся эффективным действиям, также недавно добилось заслуживающих внимания успехов. Это было хорошо продемонстрировано с помощью видеоигр, где агент учится профессионально играть в игру, используя только те же данные, что и человеческий игрок; видение экрана и без знания предметной области (т.е. правил игры). Он начался с приложения DeepMind для видеоигр Atari (см. Видео-демонстрацию здесь) в конце 2013 года и с тех пор получил много внимания и улучшений со стороны DeepMind и других групп.

Недавний успех ML также стал результатом доступности огромных наборов данных и современной вычислительной мощности. Для эффективного обучения модели требуется много данных и много времени. Графические процессоры (ГП) и заказные чипы используются для практического обучения глубоких моделей (примеры ГП и заказных чипов).

Возможно, наиболее важным фактором, сделавшим машинное обучение массовым, стала его доступность. Инструменты с открытым исходным кодом, такие как Tensor Flow, Torch и Spark, позволяют разработчикам создавать программы машинного обучения, такие как глубокие сети, способные выполнять такие задачи, как распознавание цифр, используя всего несколько строк кода.

Машинное обучение также было преобразовано в услугу крупными технологическими компаниями и другими организациями с помощью API-интерфейсов, которые позволяют дешево обучать и использовать прогнозную модель с помощью нескольких вызовов веб-служб и набора данных. Вы можете найти их примеры в Google Cloud AI, AWS ML, Microsoft Azure, IBM Watson и BigML.

На самом деле я коснулся здесь только поверхности вопроса почему именно сейчас. Вы можете найти дополнительную информацию в популярных статьях, отраслевых отчетах и официальных документах, которые были опубликованы за последнее время. Хорошим началом является этот отчет Deloitte и весьма исчерпывающий отчет правительства США администрации Обамы о возможностях, соображениях и проблемах искусственного интеллекта. Еще рекомендую это интервью Обаме об ИИ - он серьезно это понимает. Эти публикации дают исчерпывающее описание истории ML и его последствий.

Компоненты ML

Вот вам и предыстория того, почему ML сейчас так популярен. В этом посте я действительно хотел рассказать о том, как машинное обучение кардинально изменит пользовательский опыт (UX) в том виде, в каком мы его знаем. В Melbourne IT мы уже некоторое время активно экспериментируем с машинным обучением и обнаружили некоторые интересные идеи о том, как машинное обучение можно использовать, чтобы изменить то, как пользователи воспринимают продукт или услугу.

Прежде чем я расскажу о сценариях использования, над которыми мы работаем, я хочу дать краткое описание некоторых основных компонентов. В большинстве случаев машинное обучение подходит для двух очень широких методик. Первый - это кластеризация или поиск структуры ваших данных: например, сегментация пользовательских данных на несколько групп, различающихся по заданному набору функций.

Затем есть классификация. С помощью классификации можно делать прогнозы относительно новых точек данных на основе предыдущих примеров. Этот подход может применяться к непрерывным значениям, таким как прогнозирование стоимости дома на основе предыдущих продаж домов, а также к характеристикам дома, таким как количество комнат, размер земли и т. Д.

Классификация также может применяться к категориям, например, для определения числа, представленного рукописной цифрой. В этом сценарии классификация будет основана на существующем массиве рукописных цифр, где число, которое они представляют, известно системе.

Еще одна важная область машинного обучения - обучение с подкреплением, которое важно для агентных систем, действующих в своей среде. Они изучают эффективную политику выбора действий, которые приносят им максимальную награду. Сама награда выбирается для достижения желаемого результата.

Эти фундаментальные подходы к машинному обучению имеют множество форм и используются, по отдельности или в комбинации, для выполнения специфических функций более высокого порядка. Вот некоторые хорошо зарекомендовавшие себя области:

Распознавание речи: более знакомое приложение машинного обучения, в котором разговорный естественный язык преобразуется в текст. Для диктовки требуется распознавание речи, и большинство голосовых помощников сначала преобразуют речь в текст, прежде чем применять обработку естественного языка.

Обработка естественного языка (NLP): очень широкая область, охватывающая интерпретацию естественного языка (речи или текста) для понимания его значения. Например, какова была цель устного высказывания, какова была просьба или команда, а также какова была тема и настроение. Следующие 3 пункта являются ветвями НЛП.

Тематическое моделирование: определение основных обсуждаемых тем в основном тексте.

Определение тональности: определение тональности текста. Например, является ли содержание обзора «счастливым», «злым», «агрессивным»? Определение настроения часто используется для интерпретации значения обзоров и твитов.

Разговорный пользовательский интерфейс: также называемый диалоговыми системами, а в последнее время - чат-ботами. Разговорный пользовательский интерфейс - это сочетание НЛП и бизнес-логики для создания системы. который может вести разговор.

Диалоговый пользовательский интерфейс может быть простым, с предварительно настроенными ответами на ограниченный диапазон высказываний, или более сложным, способным принимать открытый диалог. Цифровые помощники, такие как Siri, Alexa и Cortana, а также приложения чат-ботов, такие как Quartz и Lark, являются примерами диалогового интерфейса. Системы диалога существуют уже давно, но в последние несколько лет стали очень популярными.

Компьютерное зрение: понимание содержания изображений. Люди настолько искусны в интерпретации изображений, что мы принимаем как должное уровень обработки, необходимый для распознавания даже простого объекта.

SLAM (одновременная локализация и отображение): построение карты окружающей среды по мере вашего движения в пределах окружающей среды, при этом выясняя, где вы находитесь на этой карте. Это было основным продуктом исследователей робототехники на протяжении десятилетий, и теперь оно появляется в основных потребительских устройствах, таких как устройства, совместимые с Google Tango.

Предиктивная аналитика: прогнозирование будущих результатов на основе прошлых примеров. Прогнозная аналитика лежит в основе большинства основных коммерческих приложений машинного обучения.

Системы рекомендаций: предоставление пользователю соответствующих и актуальных рекомендаций. Обычно рекомендации основаны на тех же пользователях и / или продуктах / услугах, которые были приобретены или потреблены ранее. Это наиболее широко используется такими компаниями, как Amazon и Netflix.

Итак, теперь мы понимаем ключевые строительные блоки или компоненты машинного обучения. Как эти компоненты используются для преобразования пользовательского опыта? Как они помогают пользователям с работой, которую нужно сделать, и как они делают эту работу легкой и приятной?

Ниже приведены некоторые примеры приложений, представленных сегодня на рынке, а также идеи, которые мы придумали на наших семинарах по новым технологиям. Некоторые примеры включают случаи, когда машинное обучение выполняется для значительного объема данных в облаке, а аналитические данные отображаются через пользовательский интерфейс. Другие примеры иллюстрируют, как машинное обучение используется на устройстве для улучшения опыта или создания ранее невозможного.

Обеспечение UX с помощью машинного обучения - сценарии использования

Интеллектуальное бюджетирование

Умное бюджетирование - это система, встроенная в банковское дело. Он автоматически анализирует расходы пользователя по типу (например, развлечения) и сообщает, когда бюджет приближается или превышается. Он дает представление о моделях расходов пользователей и дает предложения о том, как их можно изменить для достижения бюджетных целей.

Приложение может уведомить о предстоящем счете или предложить подходящее время для покупки или отказа от покупки. Бухгалтерские пакеты, такие как Mint.com, уже начинают реализовывать такие функции, и мы, вероятно, увидим продолжение этой тенденции с расширениями, ориентированными на текстовых или голосовых помощников виртуальных чат-ботов. Я удивлюсь, если крупные банки в ближайшее время не предложат эту функцию.

Чат-боты

Кварц и Жаворонок - пара хороших примеров хорошо продуманных чат-ботов. Quartz - это новостной портал, доставляющий контент в Интернете, а также в виде текстового чата в приложениях для смартфонов с изображениями в формате GIF и смайликами. Это знакомый способ взаимодействия с вашим устройством, позволяющий легко и весело просматривать новости. Пользователю предлагается указать, интересует ли он более подробную информацию или нет, поэтому разговор ведется в соответствии с интересами пользователей.

Новостные чат-боты могут быть расширены для выполнения таких задач, как мониторинг социальных сетей в сетях пользователя, определение тем и настроений, а затем использование этого контента для вовлечения пользователя в очень актуальные темы.

Lark - это приложение для здоровья, которое взаимодействует с вами через диалоговый интерфейс, который работает как тренер по образу жизни. Вы рассказываете Ларк о своей трапезе, и она дает вам советы о том, как сделать правильный выбор еды. Он также может дать вам обратную связь о том, как вы употребляете алкоголь, упражнения и режим сна, и все это поможет вам в достижении ваших целей.

Интеллектуальная безопасность

Мы видим, что пароли все чаще заменяются биометрическими данными для идентификации и аутентификации пользователей. Помимо проверки отпечатков пальцев, это распространяется на голосовую биометрию и распознавание лиц. Помимо повышенной безопасности, преимущество для пользователя состоит в том, что запоминание паролей скоро уйдет в прошлое.

Динамический интерфейс

В течение некоторого времени персонализация была в центре внимания компаний, стремящихся предоставить своим клиентам более релевантный и контекстный опыт. ИИ поможет преобразовать персонализацию опыта, выйдя за рамки того, что в настоящее время преимущественно основано на правилах, к системам на основе машинного обучения, которые учатся на поведенческих моделях пользователей. Например, можно настроить расположение элементов пользовательского интерфейса таким образом, чтобы избранные или связанные элементы были более заметными.

Магазинная дополненная реальность

ML представляет собой фантастическую возможность трансформировать опыт покупателя в магазине, позволяя брендам обеспечить более захватывающий и дифференцированный опыт розничной торговли. Одно из приложений искусственного интеллекта в магазине предполагает, что покупатели подносят свой смартфон к продукту, чтобы получить динамический 3D-дисплей. В супермаркете это может быть рецепт или информация о питании. В розничной торговле модной одеждой могут быть предоставлены дополнительные предложения - это относится к этому - или предложения относительно того, что также купили другие покупатели, купившие данную одежду.

Сравнение покупок

Компания eBay создала чат-бота с использованием Facebook Messenger, который позволяет пользователям делать фотографии чего угодно, а затем использовать распознавание изображений для выставления аналогичных товаров на продажу. Приложение выводит сравнение покупок на совершенно новый уровень.

Курирование содержания

В наши дни публикуется так много контента, что просматривать горы статей, опубликованных в Интернете, может оказаться утомительным занятием. Чат-бот может помочь в этом процессе, выбрав только релевантные статьи - на основе предыдущих шаблонов чтения - и суммируя содержание в нескольких коротких абзацах.

Дорожная упаковка

Собирая данные из различных источников - ваши учетные записи в социальных сетях могут стать отличным местом для начала - чат-бот может формировать праздничные пакеты, основываясь на исторических моделях, друзьях и трендах праздников. Просмотр ваших коллекций фотографий и отметок «Нравится» другим фотографиям может помочь сформировать представление о предлагаемых местах и занятиях. Затем можно использовать диалоговый пользовательский интерфейс, чтобы вовлечь вас в разговор об этих пакетах, чтобы еще больше сузить и уточнить предложения.

Начало работы с машинным обучением

Как видно из вышеприведенного выбора, существует множество вариантов использования машинного обучения для обогащения и переосмысления пользовательского опыта; на самом деле пределы этой технологии ограничены только воображением. Понимание строительных блоков и некоторых сценариев использования должно подтолкнуть вас к размышлениям о том, как ML может быть актуальным для вашего бизнеса и как его можно применить для улучшения пользовательского опыта.

В последнее время технология достигла такого уровня зрелости и доступности, что запуск эксперимента относительно прост, если вы знаете, что делаете. Так что подумайте о проведении эксперимента машинного обучения в своем бизнесе, который улучшит пользовательский опыт. Технология легко доступна, и есть эксперты, которые могут быстро собрать прототип, чтобы помочь проверить вашу гипотезу.