Я использовал следующую команду для создания тематической модели из некоторых документов:
bin/mallet train-topics --input topic-input.mallet --num-topics 100 --output-state topic-state.gz
Однако я не использовал параметр --output-model
для создания сериализованного объекта обучающего материала. Есть ли способ использовать файл состояния для определения тем для новых документов? Обучение идет медленно, и мне понадобится несколько дней, чтобы переучиться, если мне придется создавать сериализованную модель с нуля.