Я хочу классифицировать новостную статью по категории, к которой она принадлежит. У меня есть 4 категории новостей, например "Технологии, спорт, политика и здоровье". И я собрал около 50 документов для каждой категории в качестве обучающего набора.
**Достаточно ли тренировочных данных для классификации??? И какой алгоритм я должен использовать для классификации?? SVM, случайный лес, Knn, ??
Я использую библиотеку Scikit-learn http://scikit-learn.org/ [python] для своей задачи.
Спасибо