Я создал свои векторы терминов, как указано здесь, вот так:
~/Scripts/Mahout/trunk/bin/mahout seqdirectory --input /home/ben/Scripts/eipi/files --output /home/ben/Scripts/eipi/mahout_out -chunk 1
~/Scripts/Mahout/trunk/bin/mahout seq2sparse -i /home/ben/Scripts/eipi/mahout_out -o /home/ben/Scripts/eipi/termvecs -wt tf -seq
Затем я бегу
~/Scripts/Mahout/trunk/bin/mahout lda -i /home/ben/Scripts/eipi/termvecs -o /home/ben/Scripts/eipi/lda_working -k 2 -v 100
и я получаю:
Правильно, этого файла не существует. Как я должен его создать?
Векторы могут быть пустыми, так как при их создании может возникнуть проблема. Проверьте, успешно ли ваши векторы созданы в своих папках (имеют размер файла не 0 байт). Эта ошибка может возникнуть, если в папке ввода отсутствуют некоторые файлы. В этом случае эти два шага будут работать, хотя и не создадут действительный результат.