Я хочу вычислить stringToWordVector моего набора данных в приложении WEKA. Я обновляю параметр wordsToKeep на 50. Но он вычисляет 78 слов. Я хочу 50 слов, но он вычисляет 78 слов. Как исправить расчет?
Мой набор данных: http://www.dt.fee.unicamp.br/~tiago/smsspamcollection – ссылка 1