Что такое машинное обучение?

Машинное обучение — это наука о том, как заставить компьютеры действовать без явного программирования. Цель здесь состоит в том, чтобы разработать машину, которая может изучать и выводить закономерности и отношения из данных (и, возможно, корректировать поведение на основе этих идей). Эта область быстро развивается, и теперь мы можем выполнять такие задачи, как обработка естественного языка, компьютерное зрение, автоматический перевод и даже побеждать чемпионов по го.

Как все это сочетается? Во-первых, представьте себе создание машины, генерирующей тексты (например, генерирующей новые истории о Гарри Поттере с помощью ваших магических поворотов). Первое, что вам нужно, это текст, представляющий ваши данные. Знаменитая библиотека Александрии дает хорошее начало! Вам также понадобится представление о том, какие предложения вы хотите получить в результате этого процесса. Например, вы можете генерировать творческие или информативные тексты. Наконец, было бы лучше, если бы у вас было что-то, что может составлять предложения — в идеале следуя правилам грамматики. Может быть, это простая цепь Маркова?

В бизнесе машинное обучение уже повсюду, и мы можем ожидать, что оно будет играть не меньшую роль, чем большие данные за последние несколько лет. Даже Google RankBrain по сути представляет собой систему искусственного интеллекта для интерпретации поисковых запросов. Хотя большинство систем машинного обучения все еще довольно узкие, я предсказываю, что в ближайшие годы мы увидим системы ИИ, которые будут соперничать с человеческими способностями во все большем количестве областей — даже за пределами традиционно «полных ИИ» областей, таких как шахматы. Под этим я подразумеваю не единый роботизированный мозг общего назначения, а различные системы, оптимизированные для конкретных контекстов.

Например: что, если бы у нас было несколько отдельных систем машинного обучения, работающих на нашем телефоне: одна оптимизирована для генерации текстов, другая для понимания устных предложений и третья для зрения? Что, если бы все они были достаточно умны, чтобы взять на себя управление, когда им это нужно, а не требовать, чтобы мы управляли ими напрямую через некий пользовательский интерфейс? Это уже происходит. В вашем телефоне есть разные системы машинного обучения, каждая из которых отвечает за оптимизацию некоторых аспектов вашего опыта (например, службы определения местоположения, такие как Foursquare, используют машинное обучение для быстрого определения вашего местоположения; Snapchat использует машинное обучение для распознавания лиц; Google Фото использует машинное обучение для пометки фотографий). ).

Эти же достижения открывают возможности, выходящие далеко за рамки потребительских гаджетов, и мы можем ожидать, что машинное обучение будет играть все более важную роль во всех аспектах бизнеса. Точно так же, как промышленная революция позволила людям производить больше, чем могла когда-либо поддерживать наша мышечная сила, машинное обучение позволяет нам выйти за рамки простой силы человеческого мозга. Вот несколько примеров, когда машинное обучение будет полезно во многих областях:

Исследование рынка: насколько вероятно, что кто-то, кто купил этот продукт, также заинтересован в этом продукте? Google AdSense использует аналогичный алгоритм.

Веб-персонализация. Что вы должны представить новому пользователю на своем веб-сайте? Первое, что они, вероятно, хотят знать, это где я могу найти это? Facebook пытается предсказать, какие посты или страницы вас заинтересуют в следующий раз, используя машинное обучение.

Бизнес-аналитика. Как изменятся наши продажи в зависимости от различных вариантов маркетинга, доступных в любой момент времени? Netflix в значительной степени полагается на машинное обучение для своего механизма рекомендации фильмов, а Amazon корректирует цены на продукты на основе прошлых изменений цен. Машинное обучение может вскоре позволить McDonald’s точно прогнозировать, сколько гамбургеров им нужно произвести сегодня, вплоть до последнего гамбургера!

Машинное обучение имеет огромный потенциал во всех бизнес-приложениях. Чем больше наборы данных компании, тем более ценными будут алгоритмы машинного обучения для этой компании. В некоторых случаях все это будет совершенно очевидно: например, каждый бизнес должен знать, сколько он продает в день. В других областях, однако, машинное обучение все еще находится в зачаточном состоянии — неясно, чем именно можно стимулировать людей, чтобы они целыми днями отправляли данные со своего устройства на облачный сервер. Однако есть несколько областей, в которых мы только начинаем понимать, на что способно машинное обучение:

Творческое письмо. Например, вы можете нанять людей для написания новостных статей или сообщений в блогах, дав им некоторые основные рекомендации и позволив компьютеру написать большую часть текста.

Общение, подобное человеческому. Возможно, это даже важнее, чем творчество, и это одна из причин, почему машинам так сложно выучить язык. Здесь я имею в виду диалоговые системы, такие как Siri, Cortana или Google Now. Несмотря на то, что это все еще медленно и неудобно по сравнению с человеческим общением, со временем они улучшаются — точно так же, как они также лучше понимают контекст нашего общения (то, что мы имеем в виду, а не то, что мы говорим). Связанной областью могут быть задачи аннотирования данных, при которых работникам платят за отдельную задачу, а не за почасовую ставку. Например, если вы можете заплатить кому-то 0,10 доллара за изображение, он может аннотировать, и если каждая аннотация занимает в среднем 3 минуты, то компании нужно всего лишь выйти в безубыток при почасовой ставке 0,30 доллара в час на одного работника.

Сравнительный анализ. Компания может платить людям за параллельное сравнение различных товаров, таких как смартфоны, автомобили, стиральные машины и т. д., с использованием таких критериев, как производительность, соотношение цены и качества, функции и т. д. тем не менее, по-прежнему приходится предоставлять сравнение продуктов работникам вручную.

(Машинное обучение — динамично развивающаяся область, поэтому то, что я здесь говорю, может уже устареть к тому времени, когда вы читаете этот пост.) У компаний обычно есть сильный стимул собирать как можно больше данных о своих процессах. Это связано с тем, что алгоритмы машинного обучения лучше всего работают с большим количеством входных данных — им нужны большие обучающие наборы, чтобы делать точные прогнозы и помогать компаниям принимать ценные решения.