Сравните два файла RTF с помощью Python

У меня есть две папки с файлами RTF, имена файлов одинаковы в обеих папках
Файлы RTF состоят из верхнего и нижнего колонтитула на каждой странице
Я должен игнорировать часть верхнего и нижнего колонтитула на каждой странице и сравнивать содержимое body part
До сих пор я делал что-то подобное, я не уверен, что это правильный путь, но он работает (читает и сравнивает точное содержимое)


txt_1 = 'D:\\files\\1'
txt_2 = 'D:\\files\\2'

fol_1 = []
fol_2 = []
for fname in os.listdir(path=txt_1):
    fol_1.append(fname)
for fname in os.listdir(path=txt_2):
    fol_2.append(fname)

for i in fol_1:
    for j in fol_2:
        if i == j:
            file_1 = open(txt_1 + '\\' + i).read()
            file_2 = open(txt_2 + '\\' + j).read()
            if file_1 == file_2:
                print('Matches')
            else:
                print('Files didnt match: ' + i)

Есть ли способ игнорировать часть верхнего и нижнего колонтитула на каждой странице
Или есть ли способ игнорировать строку/строку в части нижнего колонтитула/заголовка
Есть ли какие-либо модули Python, которые я должен искать,< br/> Пожалуйста, дайте мне несколько предложений, спасибо!


person JoJo    schedule 02.10.2020    source источник
comment
Как вы проигнорировали верхний и нижний колонтитулы?   -  person Ali Tou    schedule 03.10.2020
comment
@AliTou Нет, я не знаю, как игнорировать верхний и нижний колонтитулы. Мне интересно, есть ли способ сделать это.   -  person JoJo    schedule 03.10.2020


Ответы (1)


Я не думаю, что мы можем напрямую читать и сравнивать файлы RTF на основе вашего кода. Вы должны использовать дополнительные библиотеки RTF в своем коде, чтобы читать и манипулировать вашей логикой.

Посмотрите, полезна ли вам эта ссылка.

person Riyas    schedule 03.10.2020