Какую поисковую систему с открытым исходным кодом следует использовать?

Моя цель — создать агрегатор лент новостей и лент блогов, чтобы упростить поиск/отслеживание объектов в нем. Я искал множество решений, таких как Terrier, Lucene, SWISH-E и т. д.

По сути, я смог найти только 2 источника сравнительных исследований этих двигателей, и один из них немного устарел. В основном я хочу поисковую систему, которая будет использоваться в случае, когда размер данных не слишком велик, но индексация будет частой, каждые 30 минут или около того. Я чувствую, что Terrier не является хорошим инструментом для использования в этом случае. Это работает лучше, когда размер данных велик, а частота обновления низкая. Может ли кто-нибудь, кто работал в области информационного поиска, дать совет?


person vinutheraj    schedule 13.09.2009    source источник


Ответы (2)


Lucene хорошо известна и поддерживается, поэтому лично я бы выбрал именно ее.

person daveb    schedule 13.09.2009
comment
Кажется, он согласен с вами - zooie.wordpress.com/2009/07/06/ - person vinutheraj; 13.09.2009
comment
Что, если моей основной целью является проведение исследований, а Lucene не предлагает многого в виде различных алгоритмов сходства/оценки. Есть ли какой-нибудь академический движок с открытым исходным кодом, который можно опробовать, кроме Terrier? - person vinutheraj; 15.09.2009
comment
Lucene позволяет немного манипулировать подсчетом очков. Некоторые поиски в списках рассылки должны принести некоторую информацию. - person daveb; 16.09.2009
comment
С Lucene практически ничего нельзя сделать. Для повышения производительности попробуйте clucene (Lucene на C++) — clucene.sourceforge.net - person synhershko; 19.10.2009

Если вы найдете готовую поисковую систему, проверьте fastcatsearch.

Он был разработан для коммерческого поиска и применяется на множестве различных сайтов.

Быстрее, чем Lucene, и имеет удобный веб-менеджер.

Хостинг на github, и проверить его. https://github.com/fastcatgroup/fastcatsearch

person Sang Song    schedule 03.09.2013