Найти причину, по которой файл не индексируется?

Как найти причину, по которой файл не проиндексировался в Alfresco?


person Sachin Singh    schedule 04.04.2016    source источник


Ответы (3)


В дополнение к предыдущим ответам...

Если узлы не индексируются, вы можете понять, почему. Используйте страницы администрирования SOLR и обозреватель схем. Например, см. здесь:

http://localhost:8080/solr4/#/alfresco/schema-browser?field=EXCEPTIONMESSAGE

и нажмите «Загрузить информацию о термине». Нет условий ==> нет проблем.

Также см:

http://localhost:8080/solr4/#/alfresco/schema-browser?field=EXCEPTIONSTACK

Эти поля должны были быть сохранены (они были в прошлом и будут в будущем...). Если вы чувствуете себя предприимчивым, вы можете исправить эти поля, чтобы они сохранялись в schema.xml. В следующий раз вы сможете получить сбой, связанный с конкретным узлом, через сохраненные поля — добавьте «&fl=*» к URL-адресу запроса solr, чтобы получить все сохраненные поля в результатах.

Неиндексированные узлы не индексируются по причине, а не по ошибке. Узлы, скорее всего, будут иметь аспект и свойства, которые говорят, что они не индексируются. Например, некоторая конфигурация, связанная с общим сайтом, не индексируется.

Вы можете найти основную причину ошибки индексации в журналах Alfresco, а также в полях индекса. Поля индекса более полезны, если что-то пошло не так на стороне SOLR.

Вы можете попытаться исправить узлы, используя:

http://localhost:8080/solr4/admin/cores?action=RETRY

Это даст им еще один шанс....

Также возможно, что файл проиндексировал метаданные, но не смог преобразовать его содержимое в текст. Это будет отображаться в журналах Alfresco. Вы можете увидеть, как изменилась трансформация контента, глядя на

http://localhost:8080/solr4/#/alfresco/schema-browser?field=content@s__tr_status@{http://www.alfresco.org/model/content/1.0}content

Нажмите кнопку «Загрузить информацию о термине». В основном вы должны видеть «ok» и «no_transform»

person Andy Hind    schedule 05.04.2016
comment
Привет, Энди. Я использую свойство isindexed и iscontentindexed для идентификации неиндексированного файла в alfresco solr, но оно не дает правильного значения. Можете ли вы сказать мне, что это эффективно или нет? - person Sachin Singh; 12.04.2016

См. раздел Неиндексированные транзакции Solr.

Вы можете проверить состояние индекса Solr, чтобы идентифицировать узлы транзакции, которую не удалось проиндексировать.

См. раздел Устранение неполадок индекса Solr.

Используйте эту информацию, чтобы исправить транзакцию, которую не удалось проиндексировать.

person Ahmed Owian    schedule 04.04.2016
comment
спасибо за ответ, можете ли вы сказать мне еще одну вещь, как узнать transaction_id и acltx_id bcoz, я просто нахожу узлы, которые не индексированы, и я хочу еще одну вещь, почему они не индексированы, я имею в виду причину этого bcoz в неиндексированных транзакциях Solr, это не дает описания - person Sachin Singh; 05.04.2016

Возможно, это поможет:

Переиндексировать файл в alfresco 5.0

Также ознакомьтесь с:

https://localhost:8443/solr4/alfresco/afts?q=DOC_TYPE:ErrorNode
https://localhost:8443/solr4/alfresco/afts?q=DOC_TYPE:UnindexedNode

Удачи!

person Lista    schedule 05.04.2016
comment
когда я использую этот API, он дает 10 файлов, но когда я использую свойство isIndexed, он дает 33 файла, возможно ли это или я делаю какую-то ошибку? - person Sachin Singh; 05.04.2016