Во-первых, я благодарю всех, кто находит время, чтобы помочь. Интернет-сообщество очень важно для обучения.
Общая цель: я ввожу файл .txt, останавливая его, используя сборку Java KStemmer CIIR 2003 в Eclipse и вывод списка слов с основой в другой файл .txt .
Легко: ввод .txt, сортировка .txt в массив строк или символов, вывод .txt
Проблема: я не понимаю, как использовать стеммер в моем основном коде.
Я включил код CIIR в файл класса (KStemmer.java) и импортировал следующие библиотеки:
apache-lucene-analyzers.jar
apache-lucene.jar
lucene-analyzers-common-4.2.0.jar
lucene-core-3.4.0.jar
В моем основном классе (StemThis.Java) я хочу сделать что-то вроде этого:
String wordFromTextFile = new String(); // input word
String stemmedWord = new String(); // output word
printer = new PrintWriter("outputFile") // for file export
KStemmer newStemmer = new KStemmer(); // creating a stemmer
newStemmer.stem(wordFromTextFile); // stemming a word
stemmedWord = newStemmer.return(); // get stemmed word from stemmer
printer.println(stemmedWord); // desired output method
Это явно слишком просто. Возможно, KStemmer так не работает. Как поместить строки в KStemmer и получить вывод?