Я хочу разобрать файл PDF, для этого я использую утилиту pdftotext
, которая преобразует файл PDF в текстовый файл, теперь я хочу удалить номер страницы, верхний и нижний колонтитулы из текстового файла.
Я конвертирую файл PDF, используя следующий синтаксис:
pdftotext -layout input.pdf output.txt
Может ли кто-нибудь помочь мне в этом?