Я только начинаю работать с Nutch и Solr. Я запустил сканирование один раз только с одним начальным URL-адресом. Я выполнил эту команду:
bin/nutch crawl urls -dir crawl -solr http://localhost:8983/solr/ -depth 3 -topN 5
Все идет хорошо, и я предполагаю, что Solr индексирует страницы? Итак, как мне теперь искать? Я пошел сюда localhost:8983/solr/admin/, но когда я ввожу поисковый запрос и нажимаю поиск, я получаю это:
HTTP ERROR 400
Problem accessing /solr/select/.
Reason: undefined field text
Я также попробовал пример из учебника, но когда я запускаю этот команда:
java -jar post.jar solr.xml monitor.xml
Я получаю это:
SimplePostTool: version 1.4
SimplePostTool: POSTing files to http://localhost:8983/solr/update..
SimplePostTool: POSTing file solr.xml
SimplePostTool: FATAL: Solr returned an error #400 ERROR: [doc=SOLR1000] unknown field 'name'
Моя конечная цель — каким-то образом добавить эти данные в Accumulo и использовать их для поисковой системы.