Рекомендации по настройке схемы Solr

В настоящее время я настраиваю свой файл schema.xml и пытаюсь выяснить, как лучше всего настроить мои документы. Я использую RMDBS, поэтому многие объекты являются реляционными.

Возьмем, к примеру, этот сайт; документ обычно состоит из вопроса, за которым следует 0 или более ответов. Скажем, вы хотите настроить поля для этого, вам нужно будет объявить все поля вопросов и ответов в одном документе, как я это вижу. Но учитывая тот факт, что может быть более одного ответа, вам придется создать документ для каждого ответа. Это означает, что каждый вопрос и каждый ответ хранятся в отдельном документе, который содержит поля для обоих.

Я не вижу другого подхода для такого рода проблем, однако я относительно новичок в Solr и документах БД, поэтому я могу ошибаться.

Вкратце: каковы наилучшие практики, если бы я реализовал такую ​​схему?


person Peter Kruithof    schedule 23.06.2010    source источник


Ответы (1)


Другой способ сделать это - иметь поле вопроса и многозначное поле для ответов и иметь их в одном документе. Это, вероятно, лучший способ начать, если у вас нет конкретных требований, которые благоприятствуют подходу «документ за ответ».

Например, если вам нужно сопоставить отдельные ответы как отдельные результаты поиска, вы можете получить лучшие результаты и производительность при использовании подхода «документ на ответ», поскольку документы «ответ» будут оцениваться, ранжироваться и загружаться изолированно.

Но это было бы нетрадиционным использованием данных такого типа. Обычно, когда вы ищете на сайте, таком как переполнение стека, вы ищете вопрос и набор ответов, которые охватывают определенную тему, поэтому иметь все в одном документе имеет больше смысла.

person KenE    schedule 23.06.2010