Как создать поисковик с фильтрами?

Я пытаюсь создать онлайн-поиск определенного набора литературы/цитатов/и т. д. из духовной организации, и хотя количество элементов (в основном PDF, HTML или обычный текст), которые можно найти, ограничено, я хотел предоставить исчерпывающие поисковые фильтры (в стиле Kayak.com).

Это означает, что мои данные должны быть организованы таким образом, чтобы их можно было легко фильтровать по имени автора, типу источника (будь то книга, речь, цитата и т. д.), времени и месту и другим фильтрам. То есть к каждому литературному произведению должна быть привязана эта «дополнительная информация».

Мой вопрос в том, как мне построить эту поисковую систему? Я слышал о Lucerine, а также недавно обнаружил Searcharoo, библиотеку .NET для поиска, которая будет индексировать все мои PDF-файлы, расположенные в локальном каталоге.

Мне интересно, следует ли мне использовать Searcharoo или просто создать свою собственную базу данных, в которой хранится путь к файлу, и запросить столбец, содержащий текст файла PDF. Или я могу использовать Searcharoo или что-то подобное и по-прежнему иметь возможность помечать каждый проиндексированный файл дополнительной информацией, хранящейся в БД? Или я должен использовать совершенно другой подход?

Я был бы признателен за любой вклад в это...

Спасибо!


person Community    schedule 06.07.2009    source источник


Ответы (2)


Я слышал, что CouchDB был разработан для этого, но, честно говоря, я никогда не использовал его раньше.

person oscarkuo    schedule 06.07.2009

Я использовал Lucene.NET для создания полнотекстовых индексов, содержащих дополнительные метаданные. Он стабилен, быстр и достаточно хорошо документирован, если вы не возражаете против использования порта Java.

person dthrasher    schedule 07.07.2009