Нужна помощь в понимании Solr

Я только начинаю работать с Nutch и Solr. Я запустил сканирование один раз только с одним начальным URL-адресом. Я выполнил эту команду:

bin/nutch crawl urls -dir crawl -solr http://localhost:8983/solr/ -depth 3 -topN 5

Все идет хорошо, и я предполагаю, что Solr индексирует страницы? Итак, как мне теперь искать? Я пошел сюда localhost:8983/solr/admin/, но когда я ввожу поисковый запрос и нажимаю поиск, я получаю это:

HTTP ERROR 400
Problem accessing /solr/select/.
Reason: undefined field text

Я также попробовал пример из учебника, но когда я запускаю этот команда:

java -jar post.jar solr.xml monitor.xml

Я получаю это:

SimplePostTool: version 1.4
SimplePostTool: POSTing files to http://localhost:8983/solr/update..
SimplePostTool: POSTing file solr.xml
SimplePostTool: FATAL: Solr returned an error #400 ERROR: [doc=SOLR1000] unknown field 'name'

Моя конечная цель — каким-то образом добавить эти данные в Accumulo и использовать их для поисковой системы.


person icanc    schedule 21.06.2012    source источник


Ответы (1)


Я предполагаю, что вы используете Nutch 1.4 или выше. В этом случае вам нужно изменить тип полей, которые вы добавили в файл solr/conf/schema.xml, с «текст» на «текст_общий» без кавычек.

Я работаю над достижением аналогичной цели прямо сейчас и использовал это исправление, чтобы хотя бы заставить solr работать правильно, хотя я все еще не могу заставить solr искать проиндексированные сайты. Надеюсь, это поможет, дайте мне знать, если у вас это получится.

person Gibolt    schedule 21.06.2012