Я разрабатываю функцию для поиска терминов в документе. В параметре моей функции я даю HashSet
из String
. Я просматриваю HashSet
для анализа каждой строки (с помощью класса Lucene Analyzer), затем ищу проанализированную строку в тексте с помощью класса PhraseQuery
, чтобы узнать, существует ли она в документе. Взамен моей функции есть HashSet
, который содержит только термины, найденные в документе.
Работает, но медленно, потому что просматриваю все HashSet
. Нет ли способа передать Lucene набор слов, а затем получить набор только из тех слов, которые попадают в документ?