Передовая практика свертывания полей в SOLR 1.4

Мне нужен способ свернуть дубликаты (определяемые в терминах строкового поля с идентификатором) результатов в solr. Я знаю, что такая функция появится в следующей версии (1.5), но я не могу этого дождаться. Как лучше всего удалить дубликаты, используя текущую стабильную версию 1.4?

Учитывая, что найти дубликаты в моем случае действительно легко (сравнение строкового поля), должен ли это быть фильтр, должен ли я перезаписать существующий SearchComponent или написать новый компонент, или использовать какие-то внешние библиотеки, такие как carrot2?

Общий подсчет результатов должен отражать сокращенный результат.


person Dominik    schedule 08.04.2010    source источник


Ответы (1)


Что ж, решение есть: просто примените патч для поля сворачивания (см. http://issues.apache.org/jira/browse/SOLR-236 для получения последних новостей об этой функции, я также рекомендую вам http://blog.jteam.nl/author/martijn/).

Сделав это, вы заработаете CollapseComponent . Обратите внимание, что с этой функцией связано снижение производительности поиска.

person Lici    schedule 09.04.2010