Как сделать многоуровневую классификацию вручную?

У меня есть огромный набор данных, и я хотел бы сделать многоуровневую классификацию, в которой каждый объект может быть отнесен к более чем одному классу. Для этого я использую классификатор Naive Bayer в Apache Mahout. Однако он не предназначен для классификации по нескольким меткам и просто назначает класс с наибольшей вероятностью каждому объекту. Как я могу расширить этот классификатор для своего сценария?

Одно из решений, о котором я думал, состояло в том, чтобы установить порог и назначить классы, вероятность которых больше порога. Но найти порог непросто, поэтому он не работает. Интересно знать, есть ли у кого-нибудь идеи?


person HHH    schedule 02.07.2015    source источник


Ответы (1)


Вам нужно обучить бинарный классификатор для каждого класса. Набор поездов должен содержать данные с целевым классом и другие произвольные данные, не соответствующие целевому классу.

person fatih    schedule 29.07.2015