Я пытаюсь программно преобразовать PDF в HTML. До сих пор я использовал pdftohtml, но наши пользователи недовольны результатами.
Вот что мне нужно:
Я использую Ruby on Rails, но любой инструмент, работающий в Unix, будет работать, поскольку я могу вызвать его из командной строки. Но, конечно, хороший гем или плагин был бы идеальным.
Я бы предпочел, чтобы это было с открытым исходным кодом
Он должен иметь возможность обрабатывать изображения
Было бы неплохо, если бы была возможность сбрасывать изображения при необходимости
Он должен быть стабильным
Он должен вернуть html с макетом, близким к исходному pdf (я пробовал pdftohtml, и результат не это хорошо во многих случаях)