Как исправить ошибку PSOCKcluster при запуске GBM

Я пытаюсь запустить gbm

gbm(formula=loan_status~., data=mdTrnGBM, distribution = 'bernoulli', n.trees= 100, interaction.depth= 5, bag.fraction= 0.5, cv.folds= 5)

и продолжайте получать эту ошибку:

Error in makePSOCKcluster(names = spec, ...) : 
  Cluster setup failed. 8 of 8 workers failed to connect. 

Любые идеи о том, как это исправить? Если я устраню фракцию мешка и складки cv, это, как правило, сработает, но я не хочу их устранять.


r gbm
person courty340    schedule 05.10.2020    source источник


Ответы (1)


Когда вы указываете cv = 5, gbm использует пакет parallel для отправки каждого задания перекрестной проверки на отдельное ядро. Это может быть новая проблема с новым R 4.0 и Mac .. или любой другой системой, с которой вы, возможно, работаете, см. эту ссылку.

Прямо сейчас вы можете попробовать использовать только одно ядро, если ваши данные не такие большие, используя пример набора данных:

library(gbm)
fl = "https://raw.githubusercontent.com/hrishibawane/DataLit/master/credit_train.csv"
dat = read.csv(fl)
dat = dat[dat$Loan.Status !="",]
dat = droplevels(dat[complete.cases(dat),-c(1:2)])
dat$Loan.Status = as.numeric(dat$Loan.Status)-1

mdl = gbm(formula=Loan.Status~., data=dat, distribution = 'bernoulli', 
n.trees= 100, interaction.depth= 5, bag.fraction= 0.5, cv.folds= 5,n.cores=1)

gbm(formula = Loan.Status ~ ., distribution = "bernoulli", data = dat, 
    n.trees = 100, interaction.depth = 5, bag.fraction = 0.5, 
    cv.folds = 5, n.cores = 1)
A gradient boosted model with bernoulli loss function.
100 iterations were performed.
The best cross-validation iteration was 98.
There were 16 predictors of which 16 had non-zero influence.
person StupidWolf    schedule 11.10.2020