Публикации по теме 'smote'
Модель анализа производительности сотрудников с помощью BoostingTechnique и BLSMOTE
Оглавление
Мотивация автора Подготовка инструментов для анализа и построения модели Метаданные Опишите данные Изучение данных Предварительная обработка данных Построить модель Оценка с модели "Вывод"
Мотивация автора
Производительность является частью чрезвычайно важной и интересной, потому что она доказана в свою пользу, компания хочет, чтобы сотрудники работали действительно в соответствии со своими навыками для достижения хороших результатов, без..
Обработка несбалансированных наборов данных с помощью методов передискретизации. Это плюсы и минусы.
В этой статье мы обсудим методы передискретизации, которые можно использовать для преодоления несбалансированных данных. Чтобы узнать больше о несбалансированности данных, перейдите по ссылке: https://akalbir.medium.com/what-is-an-imbalanced-data-how-to-handle-imbalanced-data-in-python-e6067792950f .
Проще говоря, я бы определил передискретизацию как противоположность недостаточной выборки, поскольку при передискретизации мы балансируем класс, просто вставляя новые точки в класс..
Вопросы по теме 'smote'
Несбалансированный набор данных — как оптимизировать гиперпараметры с помощью поиска по сетке?
Я хотел бы оптимизировать гиперпараметры C и Gamma SVC, используя поиск по сетке для несбалансированного набора данных. До сих пор я использовал class_weights='balanced' и выбирал лучшие гиперпараметры на основе среднего значения f1-баллов. Однако...
735 просмотров
schedule
19.06.2022
Как по-другому использовать словарь в алгоритме SMOTE для повторной выборки входных данных нескольких классов?
Я хочу выполнить передискретизацию с использованием алгоритма SMOTE в python с использованием библиотеки imblearn.over_sampling . Мои входные данные имеют четыре целевых класса. Я не хочу делать чрезмерную выборку всего распределения классов...
895 просмотров
schedule
07.03.2023
как использовать SMOTE и выбор функций вместе в конвейере sklearn?
from imblearn.pipeline import Pipeline
from imblearn.over_sampling import SMOTE
smt = SMOTE(random_state=0)
pipeline_rf_smt_fs = Pipeline(
[
('preprocess',preprocessor),
('selector', SelectKBest(mutual_info_classif, k=30)),...
241 просмотров
schedule
17.12.2022
Передискретизация с использованием SMOTETomek: не удалось преобразовать строку в ошибку с плавающей запятой
Когда я использую следующий код для выполнения передискретизации с использованием SMOTETomek для балансировки несбалансированного набора данных,
from imblearn.combine import SMOTETomek
import pandas as pd
# read the input dataset
input_dataset =...
42 просмотров
schedule
11.03.2023