Я пытаюсь решить некоторые проблемы классификации, используя sklearn впервые в Python, и мне было интересно, как лучше всего рассчитать ошибку моего классификатора (например, SVM) исключительно на данных обучения.
Мой пример кода для расчета точности и rmse выглядит следующим образом:
svc = svm.SVC(kernel='rbf', C=C, decision_function_shape='ovr').fit(X_train, y_train.ravel())
prediction = svc.predict(X_test)
svm_in_accuracy.append(svc.score(X_train,y_train))
svm_out_rmse.append(sqrt(mean_squared_error(prediction, np.array(list(y_test)))))
svm_out_accuracy.append((np.array(list(y_test)) == prediction).sum()/(np.array(list(y_test)) == prediction).size)
Я знаю, что из 'sklearn.metrics import mean_squared_error' я могу получить MSE для сравнения вне выборки. Что я могу сделать в sklearn, чтобы получить метрику ошибок в том, насколько моя модель хорошо / плохо классифицируется на данных обучения? Я спрашиваю об этом, потому что знаю, что мои данные не являются идеально линейно разделимыми (что означает, что классификатор неправильно классифицирует некоторые элементы), и я хочу знать, как лучше всего получить метрику ошибок, показывающую, насколько они были отключены. Любая помощь будет оценена по достоинству!