Публикации по теме 'bias-variance-tradeoff'


Тонкий танец машинного обучения: зона Златовласки
Представьте себе: вы только что закончили обучение модели машинного обучения, в которую вложили все свое сердце и душу. Вы потратили бесчисленное количество часов на настройку модели, чтобы получить ее как надо, и вам не терпится увидеть, на что она способна. Но когда вы, наконец, запустите его на некоторых тестовых данных, вы будете разочарованы, обнаружив, что он не работает так, как вы надеялись. Что пошло не так? Что ж, мой дорогой читатель, возможно, ваша модель страдает от..

Ансамблевое моделирование: почему несколько моделей лучше, чем одна?
Простое введение в ансамблевое моделирование Введение Иногда алгоритм контролируемого обучения плохо работает с данными. Причин и причин может быть много. Данные недостаточно хороши. Тенденции нет. Модель может быть слишком сложной. Если модель слишком сложна и данных недостаточно, модель может слишком хорошо соответствовать данным. Ждать! Слишком хорошо? Это означает, что данные изучают даже шум и выбросы. Это не то, чего мы хотим! Производительность алгоритма зависит от того,..

Компромисс смещения/дисперсии
Немного теоретического жаргона (но очень важный результат) статистики и машинного обучения. Ошибка обобщения модели машинного обучения может быть выражена как сумма трех очень разных ошибок: Предвзятость Предвзятость  – это ошибка обобщения, вызванная неправильными предположениями. Вы предполагаете, что данные линейны, хотя на самом деле они кубические. Модель с высоким смещением, скорее всего, не соответствует обучающим данным. Дисперсия Дисперсия  — это ошибка, возникающая..

Компромиссы дисперсии смещения
В алгоритмах машинного обучения могут возникать два основных типа ошибок: ошибка смещения и ошибка дисперсии. Эти ошибки связаны со способностью модели точно фиксировать основные закономерности в данных. Что такое предвзятость? Смещение относится к разнице между значениями, предсказанными моделью, и истинными значениями или истинностью основания. Он отражает тенденцию модели постоянно делать прогнозы, которые выше или ниже истинных значений. Что такое высокая погрешность?..