По мере того, как 4-я промышленная революция углубляется, а границы между реальным и виртуальным продолжают стираться, такие темы, как ИИ (искусственный интеллект), машинное обучение и глубокое обучение, выходят на первый план. Сегодня мы сосредоточим внимание на машинном обучении. Давайте возьмем «Машинное обучение» в качестве округа в «Штате ИИ» — огромном, сложном. Парень, который, кажется, заказывает музыку, мэр, занимается ансамблированием/обучением ансамбля. Да, это большой мальчик, с которым все хотят расслабиться (спросите конкурентов Kaggle). Давайте попробуем разобраться, кто этот парень и что он из себя представляет. Тоже в нескольких простых словах.

Первое, за что люди могут обидеться, это то, как вы произносите их имя. Я не знаю, на каком варианте английского языка вы говорите, но вот что Кембриджский словарь рассказал о том, как вы называете этого парня и что означает его имя, чтобы вы в конце концов не узнали его:

Ансамбль:

существительное [C, + петь/множественное число глагол]

US: /ˌɑːnˈsɑːm.bəl/ UK : /ˌɒnˈsɒm.bəl/

  • группа вещей или людей, действующих или взятых вместе как единое целое, особенно группа музыкантов, которые регулярно играют вместе.

Его мать, вероятно, родила его в тот день, когда его отец разрешил вековой этнический конфликт.

В Машинное обучение «Округ» вот что о нем говорят.

  • Ансамбль – это искусство объединения различных групп учащихся (отдельных моделей) вместе для импровизации стабильности и прогностической способности модели. (тавиш; Analytics Vidhya, 2015)

В этом округе мэр (ансамблирование) не обучает офицеров (моделей) с использованием разных упражнений (наборов данных), а собирает их вместе из разных мест и позволяет им продемонстрировать свое мастерство для «согласованного» выступления (прогнозирование).

Объедините сильные стороны множества разных моделей. Ансамбли обычно не предполагают обучения моделей на отдельных наборах данных — отличаются сами модели. Как правило, чем разнообразнее модели, тем лучше. Например, ансамбль может состоять из следующих моделей: машина опорных векторов (SVM), случайный лес, модель повышения градиента (GBM), логистическая регрессия, k ближайших соседей и нейронная сеть. Райан Зотти

Фото: Ашиш Патель, средний

Много раз, когда мы хотим принять определенные решения в реальном мире, мы на самом деле ведем себя как мэр — обучение ансамблем, даже не осознавая этого. Классический пример — попытка принять решение о том, стоит ли инвестировать в акции конкретной компании или нет. Будучи разумными в бизнесе, мы будем разговаривать с разными людьми с разными предубеждениями и различиями в знаниях и опыте, и мы хотим оптимизировать эти предубеждения и различия, чтобы «увидеть будущее» с хорошей уверенностью, близко к мишени.

Есть бесчисленное множество способов сделать это, но в «Machine Learning County» у мэра — ансамбля есть свои настроения (типы) и способы (методы) заглядывания в будущее (прогнозирование). Давайте внимательно изучим их, так как это даст нам некоторое представление о том, почему он является мэром.

Настроения (типы) мэра (объединение)

  1. Усреднение: среднее значение идей (прогнозов) офицеров (моделей). Это в случае проблемы регрессии или попытки определить, что возможно (вероятность) для проблемы классификации в «округе».
  2. Большинство голосов: выбор наиболее популярных идей (прогнозов) от многих офицеров (моделей) при попытке определить результат решения классификационной проблемы.
  3. Средневзвешенное значение: присвоение различной значимости/важности (веса) идеям (предсказаниям) многих офицеров (моделей) на основе их результатов, а затем «сложение двух и двух» (среднее).

Пути (методы) мэра (ансамблирования)

  1. Бэггинг:улучшение общей силы и точности выходных данных офицеров (моделей) и, таким образом, смягчение их различий (дисперсии), чтобы сделать миссию (прогноз) более выполнимой.
  2. Усиление (совокупная начальная загрузка): как и предполагалось, это обучение команды офицеров (моделей) всем упражнениям (весь набор данных), при этом некоторые остаются в отряде, а другие распределяются по другим командам (моделям). . Это похоже на то, что в каждой команде есть Тюлени. Это уменьшает предвзятость в целом и повышает успех миссии.
  3. Наложение:многие офицеры (модели) размещаются в рядах, один над другим, более низкий ранг передает информацию более высоким рангам, а самый высокий ранг принимает окончательное решение (предсказание).

Итак, с настроениями (Типы) и приемами (приемами) Мэра (Ассемблирование), давайте посмотрим некоторые его сильные и слабые стороны.

Сильные стороны

  1. Доказанная точность и способы (методы) работают в большинстве случаев.
  2. Стратегия победы в соревнованиях по машинному обучению.

Слабые стороны

  1. Кропотливый.
  2. Может стать довольно сложным и нечитаемым.

Ага! Я уверен, что вы хорошо узнали мэра (ансамблинга).

Чтобы узнать больше о мэре (ансамбли); Для дальнейшего чтения

https://datascience.stackexchange.com/questions/11057/ensembling-vs-clustering-in-machine-learning

https://www.analyticsvidhya.com/blog/2017/02/introduction-to-ensembling-along-with-implementation-in-r/

https://medium.com/ml-research-lab/ensemble-learning-the-heart-of-machine-learning-b4f59a5f9777

https://www.analyticsvidhya.com/blog/2015/08/introduction-ensemble-learning/#