Линейная регрессия не всегда друг.

Линейная регрессия не всегда подходит.

Прочитав этот пост, вы будете иметь представление о:

а) Линейная регрессия

б) Логистическая регрессия

c) Как решить проблему классификации как профессионал

Проблема классификации: распределение доступных объектов по классам в зависимости от общих качеств, присущих объекту, которые присутствуют в конкретном классе.

Давайте обсудим это на примере:

В зависимости от размера опухоли мы решаем, злокачественная она или нет.

Подход 1:

Используйте линейную регрессию, чтобы соответствовать данному набору данных

После оптимизации st.line мы получим:

Мы устанавливаем порог 0,5, если он предсказывает ‹0,5(Нет)(0) | еще (Да)(1)

Для порога в 0,5 мы получаем точку на оси X, любая точка справа от этой точки будет предсказывать 1 (Да), 0 в противном случае.

Итак, линейная регрессия также может помочь вам решить проблему классификации?

Ждать..

Возьмем еще 1 обучающий пример, который меняет st.line под данные:

Теперь даже пациенту со злокачественной опухолью скажут, что у него нет злокачественной опухоли.

Это не только страшно, но и довольно забавно.

Как видно из уравнения гипотезы линейной регрессии, диапазон функции равен (от -бесконечности до +бесконечности), в то время как нам нужно значение в [0,1] для задачи бинарной классификации

Таким образом, подход линейной регрессии терпит неудачу.