Как настроить Apache Tika с apache Solr 1.4.1

Я хочу проиндексировать большое количество pdf-документов.

Я нашел ссылку, показывающую, что это можно сделать с помощью Apache Tika, но, к сожалению, я не могу найти ссылку, в которой описывается, что я могу настроить Apache Tika в Solr 1.4.1.

После настройки я его настроил, как я могу отправлять документы в Solr напрямую, не используя curl?

Я использую solrnet для индексации.


person Ahsan Iqbal    schedule 05.10.2010    source источник


Ответы (2)


См. раздел ExtractingRequestHandler.

person Pascal Dimassimo    schedule 05.10.2010

Поддержка ExtractingRequestHandler в SolrNet еще не завершена. Вы можете либо завершить его реализацию, либо обойти его и создать свои собственные HttpWebRequests.

person Mauricio Scheffer    schedule 05.10.2010