Я пытаюсь использовать библиотеку ROSE на R для перебалансировки целевой переменной в моем наборе данных. Вот моя информация о моем наборе данных.
- В моем исходном наборе данных всего 132056 записей.
- В целевой переменной всего 279 случаев (0,21%) младшего класса.
- Всего 131777 случаев (99,79%) основного класса в целевой переменной.
Я хотел бы выполнить недостаточную выборку набора данных, чтобы увеличить процент второстепенного класса до 5%.
Вот мой код:
df_Under <- ovun.sample(Target ~ ., data = df, method = "under", N =5580, seed = 1)
Однако после запуска приведенного выше кода я получил следующее сообщение об ошибке.
"Error in (function (formula, data, method, subset, na.action, N, p = 0.5, :Too few observations."
Я пытался играть с другим методом ROSE, таким как «над» и «оба», но возникает та же ошибка.
Как я могу исправить эту проблему?
С уважением,