Я пытаюсь создать онлайн-поиск определенного набора литературы/цитатов/и т. д. из духовной организации, и хотя количество элементов (в основном PDF, HTML или обычный текст), которые можно найти, ограничено, я хотел предоставить исчерпывающие поисковые фильтры (в стиле Kayak.com).
Это означает, что мои данные должны быть организованы таким образом, чтобы их можно было легко фильтровать по имени автора, типу источника (будь то книга, речь, цитата и т. д.), времени и месту и другим фильтрам. То есть к каждому литературному произведению должна быть привязана эта «дополнительная информация».
Мой вопрос в том, как мне построить эту поисковую систему? Я слышал о Lucerine, а также недавно обнаружил Searcharoo, библиотеку .NET для поиска, которая будет индексировать все мои PDF-файлы, расположенные в локальном каталоге.
Мне интересно, следует ли мне использовать Searcharoo или просто создать свою собственную базу данных, в которой хранится путь к файлу, и запросить столбец, содержащий текст файла PDF. Или я могу использовать Searcharoo или что-то подобное и по-прежнему иметь возможность помечать каждый проиндексированный файл дополнительной информацией, хранящейся в БД? Или я должен использовать совершенно другой подход?
Я был бы признателен за любой вклад в это...
Спасибо!