Я запускаю поиск по сетке в случайных лесах и пытаюсь использовать n_jobs, отличные от одного, но ядро зависает, загрузка ЦП отсутствует. С n_jobs = 1 все работает нормально. Я даже не могу остановить команду с помощью ctl-C, и мне приходится перезапускать ядро. Я работаю в Windows 7. Я видел, что есть аналогичная проблема с OS X, но решение не актуально для Windows 7.
from sklearn.ensemble import RandomForestClassifier
rf_tfdidf = Pipeline([('vect',tfidf),
('clf', RandomForestClassifier(n_estimators=50,
class_weight='balanced_subsample'))])
param_grid = [{'vect__ngram_range':[(1,1)],
'vect__stop_words': [stop],
'vect__tokenizer':[tokenizer]
}]
if __name__ == '__main__':
gs_rf_tfidf = GridSearchCV(rf_tfdidf, param_grid, scoring='accuracy', cv=5,
verbose=10,
n_jobs=2)
gs_rf_tfidf.fit(X_train_part, y_train_part)
благодаря.