Полиномиальная ошибка в Rapidminer при классификации n-грамм

Я пытаюсь классифицировать разные понятия в тексте, используя n-грамму. Мои данные обычно состоят из шести столбцов:

Слово, которое нуждается в классификации
Классификация
Первое слово слева от 1)
Второе слово слева от 1)
Первое слово справа от 1)
Второе слово справа от 1)

Когда я пытаюсь использовать SVM в Rapidminer, я получаю сообщение об ошибке, что он не может обрабатывать полиномиальные значения. Я знаю, что это можно сделать, потому что читал об этом в разных газетах. Я установил для второго столбца значение «метка» и попытался установить для остальных значение «текст» или «реальный», но, похоже, это не дало никакого эффекта. Что я делаю не так?

TimTim 06.06.2015 источник

Ответы (2)

arrow_upward
0
arrow_downward

Вы должны использовать оператор Support Vector Machine (LibSVM). В отличие от классической SVM, которая поддерживает только задачи двух классов, реализация LibSVM (http://www.csie.ntu.edu.tw/~cjlin/papers/libsvm.pdf) поддерживает многоклассовую классификацию, а также регрессию.

David 09.06.2015

arrow_upward
0
arrow_downward

Одним из подходов может быть создание атрибутов с именами, равными словам, и значениями, равными расстоянию от интересующего слова. Конечно, все возможные слова должны быть представлены в виде атрибутов, поэтому входные данные будут большими.

Andrew Chisholm 07.06.2015

Полиномиальная ошибка в Rapidminer при классификации n-грамм

Ответы (2)

Похожие вопросы