контроль версий и слияние с pdf; постоянно обновляемые аннотации

Я использую много PDF-файлов для моих исследований и исследований. Я выделяю важные утверждения и утверждения цветовым кодом и часто добавляю текстовые аннотации в PDF-файл. Я делаю все это на своем рабочем компьютере, на своем домашнем компьютере, а также на своем планшете. Я ищу способ поделиться новыми файлами, а также поделиться недавно добавленной аннотацией с другими моими устройствами. Управление версиями, совместное использование и слияние предназначены не для текста PDF, а для аннотаций. Мне удалось найти решения только в тех случаях, когда текст PDF был проверен 1 (но даже после этого я не уверен в слиянии).

У меня есть небольшой NAS, который я могу использовать как сервер. Я рассматривал для этой задачи сервер контроля версий, такой как git, но я не нашел способа, как git мог бы проверить, были ли какие-либо изменения в pdf, и объединить их. Несмотря на то, что PDF-файлы являются двоичными, но аннотации представлены в виде простого текста, и я смог увидеть различия в vimdiff. (Хотя diff и tkdiff не помогли)

Я использовал свою учетную запись Dropbox раньше, но у меня исчерпан лимит хранилища, и я не собираюсь платить 200 евро в год, если у меня будет собственный доступный сервер. Также я хотел бы иметь возможность работать с PDF-файлами в автономном режиме, поэтому потребуется какое-то слияние. По той же причине я не могу просто работать на одном общем сетевом диске.

Это сложный вопрос, и я могу представить решения на другом уровне абстракции. Я был бы рад даже решениям, которые не связаны с git или компанией.


person Horror Vacui    schedule 14.11.2020    source источник


Ответы (1)


Вы можете использовать что-то вроде NextCloud вместо Dropbox.

Что касается слияния PDF-файлов, это, как правило, невозможно из-за, как вы уже заметили, двоичного характера PDF-файлов. Даже если некоторые части видны в текстовом diff, это не означает, что объединение таких изменений создаст действительный и работающий PDF-файл.

Ваш единственный шанс — это инструмент, который хранит аннотации за пределами PDF-файлов в удобном для слияния текстовом формате.

person gettalong    schedule 14.11.2020
comment
Несмотря на то, что формат файла является двоичным, он соответствует стандартам PDF, где также определены аннотации. На основе этого стандарта должны быть возможны различия и слияния, если программа для чтения PDF-файлов следует этому стандарту. Последняя гипотеза может быть важной, потому что, несмотря на то, что стандарт, который я нашел, относится к 2008 году, многие программы для чтения PDF даже за несколько лет до этого сохраняли свои пользовательские отметки и аннотации в другой файл, формат которого был специфичен для данной программы. - person Horror Vacui; 15.11.2020
comment
Если вы используете приложение для чтения PDF-файлов, которое сохраняет аннотации в отдельном объединяемом файле, то объединение возможно. Однако, если аннотации сохранены в PDF, объединение невозможно. Одна из причин этого заключается в том, что аннотации могут храниться не в виде простого текста, а в так называемом объектном потоке, который является двоичным и не может объединяться. - person gettalong; 16.11.2020