Мой вопрос относится к этому вопросу. Я заинтересован в вычислении кривой Precision-Recall Curve (PRC) и области под PRC. Я нашел хороший пакет R PRROC для решения обеих задач. Согласно описанию пакета (стр. 5) для функции pr.curve, вы должны указать 2 параметра. 1) оценки классификации точек данных, принадлежащих только положительному классу 2) оценки классификации точек данных, принадлежащих только отрицательному классу (см. стр. 7 руководства). Пример, который они предоставляют:
# create artificial scores as random numbers
x <- rnorm( 1000 );
y <- rnorm( 1000, -1 );
# compute PR curve
pr <- pr.curve( x, y, curve = TRUE );
Моя проблема в том, что у меня есть 14000 точек данных в положительном классе и 2560595 точек данных в отрицательном классе, и для таких данных уже 1 день, и до сих пор я не получил результатов. Для простоты вы можете попробовать расширение уже приведенного примера.
# create artificial scores as random numbers
x <- rnorm( 14000 );
y <- rnorm( 2560595, -1 );
# compute PR curve
pr <- pr.curve( x, y, curve = TRUE );