Мне нужно получить количество страниц из текстовых документов. Я протестировал множество библиотек и сценариев (apache poi, сценарии perl, некоторые приложения для Linux и некоторые другие), и единственным рабочим решением было установить Microsoft Office с Wine и получить доступ к OLE с помощью perl. Мне удалось это сделать, но, похоже, я не могу использовать его на сервере из-за проблем с лицензированием ...
Проблема с apachepoi и другими решениями, обеспечивающими доступ к информации о текстовых документах, связана с неполнотой некоторых документов. Свойство pageCount в сводке документа иногда отсутствует (это часто бывает с документами odt, сохраненными как doc и более ранними документами).
Есть ли способ на самом деле подсчитывать страницы (а не только получать информацию из сводки) без установки Microsoft Office на сервере?