Я использовал два способа расчета AUC тренировочного набора в randomForest, но получил очень разные результаты. Два способа заключаются в следующем:
rfmodel <- randomForest(y~., data=train, importance=TRUE, ntree=1000)
Способ 1 расчета AUC состава поезда:
`rf_p_train <- predict(rfmodel, type="prob",newdata = train)[,'yes']
rf_pr_train <- prediction(rf_p_train, train$y)
r_auc_train[i] <- performance(rf_pr_train, measure = "auc")@y.values[[1]] `
Способ 2 расчета AUC состава поезда:rf_p_train <- as.vector(rfmodel$votes[,2])
rf_pr_train <- prediction(rf_p_train, train$y)
r_auc_train[i] <- performance(rf_pr_train, measure = "auc")@y.values[[1]]
Способ 1 дает мне AUC около 1, а способ 2 дает мне AUC около 0,65. Мне интересно, почему эти два результата так сильно различаются. Может ли кто-нибудь помочь мне с этим? Действительно ценю это. Что касается данных, мне жаль, что мне не разрешено делиться ими здесь. Я впервые задаю здесь вопрос. Пожалуйста, простите меня, если что-то неясно. Большое спасибо!