Solr+Nutch+AjaxSolr запрос

1) Я сослался на https://github.com/evolvingweb/ajax-solr/wiki/reuters-tutorial для настройки Ajax-Solr.

Я хочу знать, что хотя ajax-solr работает, но он ищет только данные рейтеров. Если я хочу сканировать Интернет с помощью nutch и интегрировать его с solr, мне нужно заменить файл solr schema.xml на файл nutch schema.xml, который не будет соответствовать конфигурации ajax-solr. Заменив файлы schema.xml, ajax-solr не будет работать (поправьте меня, если я ошибаюсь)!!!

Как мне теперь интегрировать Solr с Nutch вместе с Ajax-Solr, чтобы ajax-Solr мог искать и другие данные в Интернете?

2) Я хотел бы спросить, есть ли какой-либо интерфейсный API для поиска Solr, кроме Ajax-Solr, который помог бы в эффективном поиске в просканированной сети?


person PythonEnthusiast    schedule 14.07.2012    source источник


Ответы (1)


  1. Посмотрите на Solr с несколькими ядрами, лучше не пытаться смешивать документы разной природы в одной коллекции
  2. Существует множество API для SOLR, например SOLRJ для Java (http://wiki.apache.org/solr/Solrj), SolPHP для PHP (http://wiki.apache.org/solr/SolPHP< /а>) и так далее.
person Alexander Chepurnoy    schedule 15.07.2012
comment
Спасибо за ваш ответ. Но поможет ли использование Solr с несколькими ядрами решить мою указанную проблему? - person PythonEnthusiast; 15.07.2012
comment
да. Однако вы будете делать 2 запроса к разным ядрам, а затем агрегировать документы с разной структурой. Другой способ, если структуры не сильно отличаются, вы можете интегрировать их в один общий schema.xml (возможно, с реализацией добавления некоторых полей в настраиваемый плагин индексирования для Nutch) - person Alexander Chepurnoy; 17.07.2012
comment
Ох!!! Спасибо за информацию... Это было действительно полезно!! Попробую.... Спасибо.. - person PythonEnthusiast; 17.07.2012
comment
Уже более 10-12 часов я застрял с этим. Пожалуйста, помогите. Спасибо. С Уважением - person PythonEnthusiast; 18.07.2012