Обоснование пренебрежения различными алгоритмами для достижения наилучшей подходящей модели

Привет, народ!

Я просматривал различные статьи о подгонке модели Data Science / ML, чтобы получить максимально возможную точность. Различные методы предварительной обработки модели, такие как удаление ненужных данных, заполнение нулевых значений, получение точных гиперпараметров и так далее.

Но ни одна статья не была существенно предложена, чтобы увидеть, как человек достиг «Окончательной» подогнанной модели, почему он выбрал только те конкретные алгоритмы, а не другие, попутно объясняя различия выбора алгоритмов. Не было написано, как выбор различных алгоритмов или, как я могу сказать, отказ от некоторых алгоритмов может повлиять на точность окончательной подгонки модели?

Каковы эффекты этих алгоритмов на разных этапах именования построения модели: предварительная обработка, выбор признаков и так далее. Они только что дали нам методы, которые, наконец, хорошо зарекомендовали себя для определенного набора данных.

Вот почему я здесь, чтобы предложить серию из 50 с лишним статей, чтобы сделать то, что эти люди не сделали.

Существенными особенностями моих статей будут:

  • Наборы данных из разных областей, которые могут решить реальные проблемы.
  • Набор данных будет проходить по разным путям, и каждый путь будет иметь разные алгоритмы на каждом этапе построения модели. Это, в свою очередь, приведет к различным «окончательным моделям» для конкретного набора данных.
  • Так как для конкретного этапа построения модели будут использоваться различные алгоритмы, я буду обосновывать причинами, почему следует использовать тот или иной алгоритм, а не использовать. Это, в свою очередь, позволит нам одновременно увидеть, как эти алгоритмы влияют на точность окончательной модели на конкретном пути.
  • Я также предоставлю подробный причудливый каркас конкретного набора данных, который может дать нам краткое представление о том, что делается на конкретном пути. Что использовали все алгоритмы и какую точность мы получили, следуя определенному пути.

Цели, которые я буду достигать с помощью этого:

  • Дать новичкам представление о том, как обосновать использование, а не использование определенного алгоритма в конкретном наборе данных.
  • Пройти и понять использование разных алгоритмов, чтобы увидеть прелесть машинного обучения.

Таким образом, я буду максимально способствовать сообществу машинного обучения.

Спасибо, что прочитали. Хлопайте, если вам нравится мой подход. Не забудьте прокомментировать, если хотите что-то уточнить. Обязательно подпишитесь на меня и поделитесь с друзьями, чтобы быть в курсе предстоящих обновлений. Увидимся в реальном мире подгонки наборов данных.