Цель машинного обучения: делать прогнозы и выполнять классификации. Чтобы достичь этой цели, мы должны решить, какой метод лучше всего соответствует нашим потребностям, используя данные тестирования.

Основные условия

Исходный набор данных должен быть очищен, изменен и преобразован, чтобы в конечном итоге он был нормально разделен на 2 набора данных:

  • Обучающие данные: просто небольшое случайное подмножество очищенных данных.
  • Тестовые данные: еще меньшее случайное подмножество очищенных данных.