По мере того, как 4-я промышленная революция углубляется, а границы между реальным и виртуальным продолжают стираться, такие темы, как ИИ (искусственный интеллект), машинное обучение и глубокое обучение, выходят на первый план. Сегодня мы сосредоточим внимание на машинном обучении. Давайте возьмем «Машинное обучение» в качестве округа в «Штате ИИ» — огромном, сложном. Парень, который, кажется, заказывает музыку, мэр, занимается ансамблированием/обучением ансамбля. Да, это большой мальчик, с которым все хотят расслабиться (спросите конкурентов Kaggle). Давайте попробуем разобраться, кто этот парень и что он из себя представляет. Тоже в нескольких простых словах.
Первое, за что люди могут обидеться, это то, как вы произносите их имя. Я не знаю, на каком варианте английского языка вы говорите, но вот что Кембриджский словарь рассказал о том, как вы называете этого парня и что означает его имя, чтобы вы в конце концов не узнали его:
Ансамбль:
существительное [C, + петь/множественное число глагол]
US: /ˌɑːnˈsɑːm.bəl/ UK : /ˌɒnˈsɒm.bəl/
- группа вещей или людей, действующих или взятых вместе как единое целое, особенно группа музыкантов, которые регулярно играют вместе.
Его мать, вероятно, родила его в тот день, когда его отец разрешил вековой этнический конфликт.
В Машинное обучение «Округ» вот что о нем говорят.
- Ансамбль – это искусство объединения различных групп учащихся (отдельных моделей) вместе для импровизации стабильности и прогностической способности модели. (тавиш; Analytics Vidhya, 2015)
В этом округе мэр (ансамблирование) не обучает офицеров (моделей) с использованием разных упражнений (наборов данных), а собирает их вместе из разных мест и позволяет им продемонстрировать свое мастерство для «согласованного» выступления (прогнозирование).
Объедините сильные стороны множества разных моделей. Ансамбли обычно не предполагают обучения моделей на отдельных наборах данных — отличаются сами модели. Как правило, чем разнообразнее модели, тем лучше. Например, ансамбль может состоять из следующих моделей: машина опорных векторов (SVM), случайный лес, модель повышения градиента (GBM), логистическая регрессия, k ближайших соседей и нейронная сеть. — Райан Зотти
Фото: Ашиш Патель, средний
Много раз, когда мы хотим принять определенные решения в реальном мире, мы на самом деле ведем себя как мэр — обучение ансамблем, даже не осознавая этого. Классический пример — попытка принять решение о том, стоит ли инвестировать в акции конкретной компании или нет. Будучи разумными в бизнесе, мы будем разговаривать с разными людьми с разными предубеждениями и различиями в знаниях и опыте, и мы хотим оптимизировать эти предубеждения и различия, чтобы «увидеть будущее» с хорошей уверенностью, близко к мишени.
Есть бесчисленное множество способов сделать это, но в «Machine Learning County» у мэра — ансамбля есть свои настроения (типы) и способы (методы) заглядывания в будущее (прогнозирование). Давайте внимательно изучим их, так как это даст нам некоторое представление о том, почему он является мэром.
Настроения (типы) мэра (объединение)
- Усреднение: среднее значение идей (прогнозов) офицеров (моделей). Это в случае проблемы регрессии или попытки определить, что возможно (вероятность) для проблемы классификации в «округе».
- Большинство голосов: выбор наиболее популярных идей (прогнозов) от многих офицеров (моделей) при попытке определить результат решения классификационной проблемы.
- Средневзвешенное значение: присвоение различной значимости/важности (веса) идеям (предсказаниям) многих офицеров (моделей) на основе их результатов, а затем «сложение двух и двух» (среднее).
Пути (методы) мэра (ансамблирования)
- Бэггинг:улучшение общей силы и точности выходных данных офицеров (моделей) и, таким образом, смягчение их различий (дисперсии), чтобы сделать миссию (прогноз) более выполнимой.
- Усиление (совокупная начальная загрузка): как и предполагалось, это обучение команды офицеров (моделей) всем упражнениям (весь набор данных), при этом некоторые остаются в отряде, а другие распределяются по другим командам (моделям). . Это похоже на то, что в каждой команде есть Тюлени. Это уменьшает предвзятость в целом и повышает успех миссии.
- Наложение:многие офицеры (модели) размещаются в рядах, один над другим, более низкий ранг передает информацию более высоким рангам, а самый высокий ранг принимает окончательное решение (предсказание).
Итак, с настроениями (Типы) и приемами (приемами) Мэра (Ассемблирование), давайте посмотрим некоторые его сильные и слабые стороны.
Сильные стороны
- Доказанная точность и способы (методы) работают в большинстве случаев.
- Стратегия победы в соревнованиях по машинному обучению.
Слабые стороны
- Кропотливый.
- Может стать довольно сложным и нечитаемым.
Ага! Я уверен, что вы хорошо узнали мэра (ансамблинга).
Чтобы узнать больше о мэре (ансамбли); Для дальнейшего чтения
https://datascience.stackexchange.com/questions/11057/ensembling-vs-clustering-in-machine-learning
https://medium.com/ml-research-lab/ensemble-learning-the-heart-of-machine-learning-b4f59a5f9777
https://www.analyticsvidhya.com/blog/2015/08/introduction-ensemble-learning/#