Продуктовое мышление для машинного обучения

В конце концов, машина - это всего лишь инструмент, который может помочь человечеству быстрее развиваться, сняв с него часть бремени вычислений и интерпретаций. Задача человеческого мозга остается прежней; обнаружение новых данных для анализа и разработка новых концепций для тестирования.

Исаак Азимов «Неизбежный конфликт»

Индустрия высоких технологий полна историями о том, как машинное обучение и искусственный интеллект в целом меняют бизнес новыми и захватывающими способами. Хотя многие из приложений, которые мы видим сегодня, являются новыми, технология, лежащая в основе большинства платформ машинного обучения, существует уже несколько десятилетий. Машинное обучение может показаться черным ящиком из-за сложности алгоритмов и концепций в этой области. У инженеров, работающих с ними, не всегда есть абсолютная уверенность в отношении этих систем. Некоторые из наиболее важных вопросов в будущем будут заключаться в том, как и почему эти алгоритмы создаются и используются в будущем. Дизайн-мышление играет центральную роль в ответах на эти вопросы и в формировании способа построения прикладного ИИ.

Нейронные сети

Глубокое обучение стало популярным в последние несколько лет благодаря достижениям в нейронных сетях. Короче говоря, нейронная сеть принимает помеченные обучающие данные и выдает модель, которая определяет тенденции на основе этих данных, чтобы маркировать или генерировать новые данные. Это очень важно для таких задач, как спам-фильтры, перевод и обнаружение объектов на фотографиях.

Деревья решений

Еще один популярный метод машинного обучения - дерево решений. Общий принцип этой модели - оценить, какая информация наиболее точно предсказывает определенное поведение. Например, какие факторы наиболее сильно влияют на статус отношений.

Эти подходы звучат по-разному, но оба они относятся к контролируемому обучению. Обучение с учителем основано на больших помеченных наборах данных, в отличие от обучения без учителя, которое фокусируется на неструктурированных наборах данных. Чтобы построить хорошую модель прогнозирования, системе требуются большие объемы размеченных данных и четкие цели.

Применение ML

Это тот момент, когда дизайнеры, менеджеры по продуктам и специалисты по обработке данных могут быть очень полезны в создании или информировании о стратегии машинного обучения. Единственная наиболее важная вещь, которая помогает определить успех модели машинного обучения, - это данные, функции и контекст, которые используются для обучения модели. Хотя алгоритмы, оптимизация и реализация могут оставаться в некоторой степени абстрактными, продуктовые группы могут помочь направить и сфокусировать команду инженеров на поиск интересных данных, создание модели, которая соответствует варианту использования, и информирование конечного пользователя. Две проблемы, с которыми сталкиваются модели машинного обучения, - это примеры, выходящие за рамки определенного варианта использования, и устранение разрыва с помощью другого аналогичного, но отдельного варианта использования.

Следовательно, выявление крайних случаев и понимание объема, который может потребоваться в модели с течением времени, чрезвычайно важны для успеха продукта машинного обучения.

Самым большим бизнес-кейсом для ML была реклама, потому что она наиболее тесно коррелирует с бизнес-моделями и имеет явный пример успеха. Некоторые из других эффективных приложений машинного обучения связаны с распознаванием объектов в изображениях. Например, у Pinterest есть один из самых сложных алгоритмов распознавания объектов на рынке, который помогает платформе рекомендовать аналогичный контент и узнавать, какие темы интересуют их пользователей. Рекомендации - это еще один очень важный бизнес-кейс: будь то рекомендовать товары или услуги на таких платформах, как Amazon, за кем подписаться в таких сетях, как Twitter, или просто курировать большой набор контента на таких платформах, как Medium. Другая большая категория влияния на бизнес - это прогнозирование. Это может включать в себя прогнозирование поведения пользователей на основе предыдущей деятельности, на примере урожайности сельскохозяйственных культур или даже прогнозирование и определение последствий для здоровья, таких как рак, на основе тестов ДНК. Хотя есть много других случаев, таких как беспилотные автомобили, и более экстремальные темы общего интеллекта, такие как проект IBM Watson или Open AI, я сосредоточусь на стандартных практиках, с которыми я лично работал в повседневной работе с продуктами.

Понимание успеха

Один из самых сложных аспектов запуска нового проекта машинного обучения - определение успеха. Обучение моделей в больших системах может занять недели или месяцы. Воздействие не всегда гарантировано как из-за внешних факторов, таких как рост и отток пользователей, так и из-за того, что сама цель плохо определена. В некоторых случаях можно продавать прямой результат модели, например, в контексте B2B. В других случаях можно надеяться, что проект приведет к конкретным результатам. Например: читать больше статей, покупать больше товаров или быстрее находить информацию. Важно точно указать, на какие цели и показатели вы пытаетесь повлиять. Спрогнозируйте, какими были бы эти показатели, если бы человек ничего не делал или не делал по минимуму. Задайте такие вопросы, как: сколько торговых звонков мы ожидаем сделать в этот раз в следующем году, если ничего не изменится? На что бы мы потратили время? Затем решите, какой эффективности вы хотите добиться. Во многих случаях машинное обучение помогает оптимизировать хорошую систему, однако это не всегда лучшая удача для сломанной. Тем не менее, вы можете тестировать совершенно новое приложение. Некоторые системы ИИ меняют правила игры. В этих случаях нет предела. Будьте реалистичны в отношении того, что пытается сделать продукт, и поставьте соответствующие цели.

Выбор функции

Одна из самых сложных задач при построении алгоритма, ориентированного на конкретную задачу, - это выбор и извлечение признаков. Это процесс принятия решения о том, какие данные достаточно ценны для использования и как можно преобразовать этот выбор в более значимые фрагменты информации. Например, вы можете порекомендовать статьи для публикации и определить актуальные темы. Под рукой может быть множество статей разного качества, одни от авторитетных авторов, другие от случайных блоггеров. Правильный выбор функции может сделать алгоритм более надежным. Если вы изобретательны, вы можете попытаться проанализировать грамматику и пунктуацию. Конечным результатом является список функций, которые необходимо извлечь: уровень чтения, дикция, сленг, пунктуация, количество изображений, плагиат и так далее. Один анекдот из первых дней работы в Yahoo! заключалась в том, что ранжирование статей с двоеточиями и точками с запятой резко уменьшало количество тирадов, которые появлялись на первой странице результатов поиска. Это то, что может помочь определить любая продуктовая команда.

По сути, ML - это система, которая выявляет сложные закономерности и взаимосвязи. В качестве общего примера, B повышается, A понижается, если C не больше 1. Что делает эти алгоритмы успешными, так это размер, качество и актуальность A, B и C. Цели при работе с такими командами - помочь Убедитесь, что люди точно регистрируют данные, думают о новых и интересных способах извлечения из них новых идей и находят лучший способ связать их с основным опытом работы с продуктом.

Дизайн пользовательского интерфейса для машинного обучения

При разработке интерфейса существует множество способов, которыми пользовательский интерфейс и дизайн взаимодействия могут напрямую улучшить модели, созданные с помощью машинного обучения. В большинстве случаев ИИ на уровне платформы тренируется на основе обучения с подкреплением. Это процесс постепенного и неуклонного оказания помощи системе в понимании того, какие результаты являются наиболее ценными в данный момент. Дизайн может сообщить об этом двумя способами. Первый - это пассивная обратная связь. Создавая чистые пользовательские потоки и отслеживая, как люди переходят с одной поверхности на другую, команда может создавать наборы данных, которые содержат все виды настроек. Amazon делает это постоянно. Все, что нужно сделать, это перейти на страницу продукта, посвященную обуви, и внезапно, когда кто-то заходит на домашнюю страницу, пользователю автоматически рекомендуются различные стили обуви. Некоторые компании даже изменят рециркуляцию своего приложения в зависимости от того, как оно используется.

Другой огромный способ, которым дизайн может повлиять на модели машинного обучения, - это создание петель обратной связи с контентом через взаимодействие с пользователем. Это активная обратная связь, которая может содержать подробные метки для людей, сообщающих о оскорбительном контенте, и, в свою очередь, помогает предсказать плохое поведение в отношении вашего продукта. Пометка может быть реализована, чтобы помочь лучше понять содержание изображения, размещаемого на вашем сайте. Можно построить рейтинговую систему, чтобы лучше угадывать, какие рестораны и магазины могут быть интересны покупателю. Это все активные механизмы обратной связи, которые пользовательский интерфейс разрабатывает, планирует, размещает и стиль, которые затем передаются в ценные наборы данных, которые используются в будущих предложениях. По мере того, как предложения станут лучше, вы увидите улучшенные конверсии, удовлетворенность и больше данных, которые ваши модели прогнозирования правильно угадывают.

Одна из самых сложных частей улучшения модели - это сбор данных, которые будут двигать стрелку. Netflix организовал знаменитый конкурс по улучшению алгоритма рекомендаций. Хороший приз будет вручен тому, кто сможет повысить производительность на 1%. Однако к тому времени, когда алгоритм победы должен был быть реализован в следующем году, он уже устарел, потому что платформа сильно изменилась. Дизайн пользовательского интерфейса платформы и машинного обучения, на котором она основана, часто должны меняться вместе, чтобы оставаться актуальными.

Модельный дизайн

Одна из самых полезных вещей, которые команда разработчиков может внести в сложную или платформенную систему ИИ, - это организация. Как и любая другая техническая система, встраивание ИИ в платформу часто состоит из множества отдельных частей и компонентов. Выделите время на доску и вытащите модели коробок или краткие описания продуктов. Технические характеристики помогут вашей команде не сбиться с пути: запомнить все важные компоненты и обнаружить пробелы в мышлении. Эта практика неоднократно помогала мне лично. В одном случае обсуждение технической архитектуры рекламной системы помогло мне понять, что то, что мы создаем, также может влиять на инструменты для работы с трендовыми темами. В другом случае обзор архитектуры модели помог мне выделить области, в которых мы могли бы лучше вести журнал и использовать работу машинного обучения, выполняемую другими командами.

Вложения

Вложения - это пространственная метафора для организации свидания. Вложения абстрактны, но самый простой способ их описать - это организовать взаимосвязи информации. Таким образом, если вы систематизируете фотографии, фотографии кошек будут появляться рядом с фотографиями других кошек и так далее. Существует множество приложений внедрения, но ядро - это масштабируемый способ масштабируемой корреляции информации. Instagram использует их для кластеризации фотографий, Google использует их для поиска изображений, чат-боты используют их для ответа на ввод текста, Netflix использует вложения для рекомендации контента. Они могут быть правильным способом организации ваших данных, если у вас есть проблемы с масштабированием или организацией большого количества контента.

Резюме

Все концепции, изложенные в этой статье, помогли мне добиться успеха и понять, как я могу лучше внести свой вклад в технический продукт. Есть много способов, которыми ИИ станет более мощным в ближайшие годы. Однако люди будут решать, какие проблемы необходимо решить, какая информация является полезной и как эти технологии будут использоваться. Один из моих ключевых выводов за годы работы в этой области заключается в том, что лучше всего иметь информацию о данных. Если руководствоваться исключительно данными, это может затруднить понимание лучших способов думать об успехе, целях и о том, откуда придет следующая информация, которая поможет вашей команде или компании добиться следующего крупного успеха.