Ну, мне нужно было сделать заголовок броским, чтобы вы это прочитали, верно?

Это одна из вводных концепций машинного обучения, и очень важно понимать разницу, поскольку у каждой проблемы есть свое решение. Надеемся, что прочтение этой статьи поможет вам быстрее решать проблемы!

Эта статья основана на уроке базового курса Udacity по машинному обучению Microsoft Azure. Мне повезло, что меня выбрали в качестве одного из получателей стипендии на первом этапе, поэтому я поделюсь некоторыми советами, которые могут быть полезны новичкам, прогуливающимся в области машинного обучения. Давайте начнем.

Три подхода к решению любой проблемы машинного обучения:

- Обучение с учителем

- Обучение без учителя

- Обучение с подкреплением

Контролируемое обучение

Разницу между контролируемыми и неконтролируемыми легко понять, это ясно из названия. Каждый раз, когда вы сталкиваетесь с проблемой, в которой известен ожидаемый результат, это обучение с учителем. По сути, вы можете представить себя контролирующим машину, чтобы она могла изучать шаблоны и параметры так, как вы этого хотите. Некоторые примеры проблем, относящихся к этому домену, включают: выявление спама из пула электронных писем на основе различных факторов, определение того, желает ли человек определенного возраста, пола, расы, финансового положения и т. Д. Покупать товар или нет, прогнозирование заработной платы сотрудника при условии, что некоторые зарплаты уже известны.

На изображении ниже показаны записи об учащихся, содержащие их баллы GPA и GRE, а также то, смогли ли они обеспечить поступление в конкретный университет. 0 означает, что допуск не предоставлен, а 1 означает успешный допуск. Обучая эту модель, мы сможем предсказать, будут ли такие-то баллы давать кандидату право на зачисление (если не будут внесены изменения в политику приема).

Приведенные выше примеры можно разделить на категории:

  • Классификация: выходные данные с пометкой являются категориальными по своей природе, например, спам / не спам, произведено куплено / не куплено. Однако для обучения нашей модели он обозначается числами, например 0 для спама, 1 для не спама. Когда возможны только два выхода, это называется двоичной классификацией. Когда существует несколько выходов, это называется классификацией по нескольким меткам. Например, прогнозирование характера прогулки человека, будь то езда на велосипеде, ходьба, спринт или езда на горном велосипеде.
  • Регрессия: помеченные результаты имеют числовой характер, например оценка заработной платы сотрудника. Это означает, что они также являются непрерывными, в отличие от результатов, наблюдаемых в задачах классификации.
  • Изучение функций: модель может автоматически изучать функции на основе необработанных данных и использовать их.
  • Обнаружение аномалий: классификация с помощью данных, помеченных как нормальные / ненормальные. Например, выявление причин возможных перебоев в обслуживании.

Неконтролируемое обучение

Когда в данных не представлены выходные данные, модель находит скрытые закономерности, которые могут оказаться полезными для нас. Здесь нет надзора или вмешательства человека, так как не предоставляются помеченные результаты в попытке направить модель на поиск предполагаемой тенденции. Категории в этом домене:

  • Кластеризация: объединение сущностей в разные группы, также известные как кластеры, на основе различных факторов для экономии времени и усилий. Обычно это делают компании и бренды, поэтому могут быть реализованы разные маркетинговые стратегии, нацеленные на разные кластеры, чтобы в конечном итоге увеличить продажи и доход. На изображении ниже показаны 5 групп, на которые были разделены клиенты в зависимости от их годового дохода и баллов по расходам в торговом центре.

  • Изучение функций: функции также можно узнать из данных без ярлыков, это сложно, но возможно.
  • Обнаружение аномалий: отличия нормальных данных от аномальных без каких-либо ярлыков, исходя из предположения, что большинство записей на самом деле являются нормальными.

Обучение с подкреплением

Обучение основано на функции вознаграждения, и максимизация этой функции вознаграждения - это то, что побуждает агента работать лучше. Примером может служить Марковский процесс принятия решений, который представляет собой математическую модель. Он используется для моделирования принятия решений, где определенные факторы могут быть соответствующим образом настроены, однако могут быть внешние помехи.

Ключевое различие между этими подходами заключается в том, что обучение с учителем и обучение без учителя - это «пассивные» подходы, тогда как подкрепление больше похоже на «активное». Это связано с тем, что действие, предпринимаемое агентом, может повлиять на среду и может изменить будущие состояния. Принимая это во внимание, обучение с подкреплением больше подходит для таких сценариев, как игры, разработка роботов и беспилотные автомобили.

Теперь, когда вы знакомы с тремя подходами, похлопайте себя по плечу! 😁👏