Мы используем Solr 1.4 для получения результатов по запросам пользователей. Результаты извлекаются из индекса, содержащего примерно 500 тыс. документов. Индекс постоянно пополняется новыми документами, а срок действия старых документов истекает.
Страницы результатов представляют собой списки документов, отсортированные по релевантности (оценке), автоматически вычисляемой solr в зависимости от запроса пользователя. Каждый документ принадлежит к одной категории (например, инженерия, финансы, администрация, математика и т. д.), а идентификатор категории хранится и индексируется Solr.
Чего мы хотим добиться, так это того, чтобы документы сортировались по релевантности, а также каким-то образом взвешивались, чтобы по крайней мере первая страница результатов (10, 20 или 50) содержала документы из как можно большего количества категорий и как можно меньше документов из той же категории являются последовательными.
Мы много искали, но так и не смогли найти ни одного возможного сценария.
Заранее большое спасибо за любые идеи. ГК