Цель машинного обучения: делать прогнозы и выполнять классификации. Чтобы достичь этой цели, мы должны решить, какой метод лучше всего соответствует нашим потребностям, используя данные тестирования.
Основные условия
Исходный набор данных должен быть очищен, изменен и преобразован, чтобы в конечном итоге он был нормально разделен на 2 набора данных:
- Обучающие данные: просто небольшое случайное подмножество очищенных данных.
- Тестовые данные: еще меньшее случайное подмножество очищенных данных.