Публикации по теме 'regression'


Регрессия дерева решений
Дерево решений - это модель прогнозирования, которая использует набор двоичных правил для вычисления зависимой переменной. Каждое дерево состоит из ветвей, узлов и листьев. Прежде чем двигаться дальше, давайте познакомимся с некоторой терминологией: корневой узел представляет всю совокупность и разделен на два или более однородных набора. Узел решения - это когда подузел разделяется на дополнительные подузлы. Лист - это когда узел не разделяется. Их также называют..

Демонстрация контролируемого алгоритма машинного обучения: логистическая регрессия
Логистическая регрессия — это популярный алгоритм, используемый для задач бинарной классификации в контролируемом машинном обучении. Но что это значит? Ну, в бинарной классификации мы пытаемся предсказать один из двух возможных результатов или категорий. Например, мы можем захотеть предсказать, является ли электронное письмо спамом или нет, или сдаст или провалит студент экзамен. В отличие от линейной регрессии, предсказывающей числовые значения, логистическая регрессия предсказывает..

ТИПЫ РЕГРЕССИИ
Методы регрессии являются одним из самых популярных статистических методов, используемых для прогнозного моделирования и задач интеллектуального анализа данных. В среднем специалисты по аналитике знают только 2–3 типа регрессии, которые обычно используются в реальном мире. Это линейная и логистическая регрессия. Но дело в том, что существует более 10 типов алгоритмов регрессии, предназначенных для различных видов анализа. Каждый тип имеет свое значение. Каждый аналитик должен знать,..

Коллинеарность: подлый виновник завышенных стандартных ошибок в вашем регрессионном анализе
Что такое коллинеарность? Коллинеарность (также известная как мультиколлинеарность) — это явление в статистике, когда две или более независимых переменных в регрессионной модели сильно коррелируют друг с другом. Почему важно учитывать коллинеарность? Коллинеарность между независимыми переменными приводит к нестабильным и ненадежным оценкам коэффициентов регрессии и завышенным проблемам стандартной ошибки в регрессионном анализе, что затрудняет интерпретацию результатов и делает..

Метод прогнозирования продаж BigMart Sales
Этот пост посвящен моему подходу к проблеме прогнозирования продаж Bigmart с использованием Python. У меня было собеседование, где мне прислали эту проблему в качестве задачи для решения. Прежде всего, посмотрите на BigMart описание проблемы: Исследователи данных из BigMart собрали данные о продажах 1559 товаров в 10 магазинах в разных городах за 2013 год. Также были определены определенные атрибуты каждого продукта и магазина. Цель состоит в том, чтобы построить прогностическую..

Дерево регрессии с нуля с использованием Python
В этой статье я погружаюсь в тему дерева регрессии и его основных математических основ. Я постараюсь объяснить это как можно проще и создать рабочую модель с использованием python с нуля. Я буду использовать рекурсию для создания узлов дерева, поэтому, если вы не знакомы с этим, я рекомендую посмотреть несколько примеров и пояснений в Интернете (хотя я все же кратко объясню его логику). Импорт import pandas as pd import numpy as np import matplotlib.pyplot as plt Создание данных..

Машинное обучение
полное машинное обучение Машинное обучение дает предложения по решению сложных задач. в Ml мы прогнозируем значение на основе предыдущих данных Тип задач машинного обучения контролируемый неконтролируемый Под наблюдением:- в контролируемом алгоритме у нас есть входное и выходное значение мы прогнозируем результат на основе заданных данных, мы разделяем данные на две части: одна — данные обучения, а другая — тестовые данные. в контролируемом алгоритме у нас есть два..