Публикации по теме 'xgboost'


Привет Бенуа
Привет Бенуа Спасибо за познавательный пост, это именно то, что я искал! Но я немного запутался в результатах, которые я получил после небольшого эксперимента - я изменил функцию generate_data на больший диапазон и больше точек данных: X_train = np.atleast_2d(np.random.uniform(0, 20.0, size=300)).T X_test = np.atleast_2d(np.linspace(0, 20.0, 1000)).T Никаких других изменений кроме этих. Это результаты, которые я получил, которые сбивают с толку, я что-то упускаю?

Бинарная классификация доходов домохозяйств на Филиппинах
Введение Надеемся, что большинство из вас в Соединенных Штатах заполнили данные переписи населения 2020 года. Я так и сделал, и это было своевременное упражнение, когда я одновременно работал с набором данных о домохозяйствах, выбирая население страны. Статистическое управление Филиппин каждые три года проводит обследование под названием «Обследование семейных доходов и расходов» (FIES) для сбора информации о доходах, уровне жизни и расходах на жилье во всех семнадцати регионах...

Прогноз неплательщиков по кредиту — XGBoost (BoostARoota + Optuna) + Perceptron + H2O.ai + другие модели машинного обучения
Прогнозирование неплательщиков по кредиту — XGBoost (BoostARoota + Optuna) + Perceptron + H2O.ai + другие модели машинного обучения Решаем хакатон (бинарная классификация)! В этом посте мы собираемся решить хакатон и узнать, как применять модели ML для задач классификации. Статья разделена на 8 частей, как показано ниже. Постановка задачи Метрика оценки Требуемые пакеты питона ЭДА Построение модели и прогнозирование Заключение Следующие шаги Ссылки (ноутбук jupyter со всеми..

Эксперименты с машинным обучением и реестр моделей с Neptune.ai
Экспериментирование является неотъемлемой частью любого сложного процесса; включен процесс построения моделей машинного обучения. Построение «успешной» модели машинного обучения означает оптимизацию на нескольких уровнях, эти уровни (не в порядке важности): тип модели, гиперпараметры модели, особенности данных и наборы данных, используемые для обучения и тестирования. Причину этой оптимизации легко понять для первых двух: Различные модели имеют разные возможности и разные..

Что такое XGBoost и как его оптимизировать
Что такое XGBoost? А как его оптимизировать? В мире машинного обучения и соревнований Kaggle алгоритм XGBoost занимает первое место. Вступление Как и многие специалисты по обработке данных, XGBoost теперь является частью моего набора инструментов. Этот алгоритм является одним из самых популярных в мире науки о данных (реальном или соревновательном). Его многозадачность позволяет использовать его в проектах регрессии или классификации. Его можно использовать для табличных,..

Kaggle X Цены на авокадо (2/2)
Чтобы вспомнить, что мы сделали с ценами на авокадо, посмотрите предыдущий пост здесь . Итак… краткий обзор наших предположений в прошлый раз. Средняя цена варьируется в зависимости от региона (можно предположить, что регион играет решающую роль в прогнозировании средней цены), и средняя цена обычного авокадо росла с 2015 по 2018 год независимо от региона. Органические авокадо дороже обычных. На среднюю цену авокадо влияют годы, регионы, сорта. С учетом трех вышеприведенных..

Модель анализа производительности сотрудников с помощью BoostingTechnique и BLSMOTE
Оглавление Мотивация автора Подготовка инструментов для анализа и построения модели Метаданные Опишите данные Изучение данных Предварительная обработка данных Построить модель Оценка с модели "Вывод" Мотивация автора Производительность является частью чрезвычайно важной и интересной, потому что она доказана в свою пользу, компания хочет, чтобы сотрудники работали действительно в соответствии со своими навыками для достижения хороших результатов, без..