Публикации по теме 'xgboost'
Привет Бенуа
Привет Бенуа
Спасибо за познавательный пост, это именно то, что я искал! Но я немного запутался в результатах, которые я получил после небольшого эксперимента - я изменил функцию generate_data на больший диапазон и больше точек данных:
X_train = np.atleast_2d(np.random.uniform(0, 20.0, size=300)).T
X_test = np.atleast_2d(np.linspace(0, 20.0, 1000)).T
Никаких других изменений кроме этих. Это результаты, которые я получил, которые сбивают с толку, я что-то упускаю?
Бинарная классификация доходов домохозяйств на Филиппинах
Введение
Надеемся, что большинство из вас в Соединенных Штатах заполнили данные переписи населения 2020 года. Я так и сделал, и это было своевременное упражнение, когда я одновременно работал с набором данных о домохозяйствах, выбирая население страны. Статистическое управление Филиппин каждые три года проводит обследование под названием «Обследование семейных доходов и расходов» (FIES) для сбора информации о доходах, уровне жизни и расходах на жилье во всех семнадцати регионах...
Прогноз неплательщиков по кредиту — XGBoost (BoostARoota + Optuna) + Perceptron + H2O.ai + другие модели машинного обучения
Прогнозирование неплательщиков по кредиту — XGBoost (BoostARoota + Optuna) + Perceptron + H2O.ai + другие модели машинного обучения
Решаем хакатон (бинарная классификация)!
В этом посте мы собираемся решить хакатон и узнать, как применять модели ML для задач классификации. Статья разделена на 8 частей, как показано ниже.
Постановка задачи Метрика оценки Требуемые пакеты питона ЭДА Построение модели и прогнозирование Заключение Следующие шаги Ссылки (ноутбук jupyter со всеми..
Эксперименты с машинным обучением и реестр моделей с Neptune.ai
Экспериментирование является неотъемлемой частью любого сложного процесса; включен процесс построения моделей машинного обучения. Построение «успешной» модели машинного обучения означает оптимизацию на нескольких уровнях, эти уровни (не в порядке важности):
тип модели, гиперпараметры модели, особенности данных и наборы данных, используемые для обучения и тестирования.
Причину этой оптимизации легко понять для первых двух:
Различные модели имеют разные возможности и разные..
Что такое XGBoost и как его оптимизировать
Что такое XGBoost? А как его оптимизировать?
В мире машинного обучения и соревнований Kaggle алгоритм XGBoost занимает первое место.
Вступление
Как и многие специалисты по обработке данных, XGBoost теперь является частью моего набора инструментов. Этот алгоритм является одним из самых популярных в мире науки о данных (реальном или соревновательном). Его многозадачность позволяет использовать его в проектах регрессии или классификации. Его можно использовать для табличных,..
Kaggle X Цены на авокадо (2/2)
Чтобы вспомнить, что мы сделали с ценами на авокадо, посмотрите предыдущий пост здесь .
Итак… краткий обзор наших предположений в прошлый раз.
Средняя цена варьируется в зависимости от региона (можно предположить, что регион играет решающую роль в прогнозировании средней цены), и средняя цена обычного авокадо росла с 2015 по 2018 год независимо от региона. Органические авокадо дороже обычных. На среднюю цену авокадо влияют годы, регионы, сорта.
С учетом трех вышеприведенных..
Модель анализа производительности сотрудников с помощью BoostingTechnique и BLSMOTE
Оглавление
Мотивация автора Подготовка инструментов для анализа и построения модели Метаданные Опишите данные Изучение данных Предварительная обработка данных Построить модель Оценка с модели "Вывод"
Мотивация автора
Производительность является частью чрезвычайно важной и интересной, потому что она доказана в свою пользу, компания хочет, чтобы сотрудники работали действительно в соответствии со своими навыками для достижения хороших результатов, без..