Установка максимальной длины строки в ExtractingRequestHandler (Solr Cell).. setMaxStringLength()

Я использую Solr и ExtractingRequestHandler для индексации документов, но я не знаю, как сделать эквивалент Tika setMaxStringLength().

Похоже, что он индексирует все меньшие документы, но не весь текст большого документа, что может означать, что он не устанавливает tika.setMaxStringLength(-1)

Можно ли установить значение в solrconfig.xml? Можно ли передать значение вместе с другими параметрами при публикации с помощью curl?


person mlevy    schedule 23.05.2013    source источник


Ответы (1)


Проверьте файл конфигурации Solr на предмет ограничения

<maxFieldLength>10000</maxFieldLength>

Это ограничит длину поля, что может вызвать у вас проблемы.

Какую версию solr вы используете, поскольку она, возможно, устарела.

IndexConfig в SolrConfig

Параметр maxFieldLength был удален в Solr 4. Если для вас важно ограничение длины полей, вы можете добиться аналогичного поведения с помощью LimitTokenCountFactory, который можно определить для полей, которые вы хотите ограничить. Например, ограничит поле до 10 000 символов.

person Jayendra    schedule 24.05.2013
comment
Спасибо. maxFieldLength действительно был виновником в моем случае, как вы предположили. Я все еще использую Solr 3.x и скоро перейду на Solr 4. - person mlevy; 24.05.2013