У меня есть две папки с файлами RTF, имена файлов одинаковы в обеих папках
Файлы RTF состоят из верхнего и нижнего колонтитула на каждой странице
Я должен игнорировать часть верхнего и нижнего колонтитула на каждой странице и сравнивать содержимое body part
До сих пор я делал что-то подобное, я не уверен, что это правильный путь, но он работает (читает и сравнивает точное содержимое)
txt_1 = 'D:\\files\\1'
txt_2 = 'D:\\files\\2'
fol_1 = []
fol_2 = []
for fname in os.listdir(path=txt_1):
fol_1.append(fname)
for fname in os.listdir(path=txt_2):
fol_2.append(fname)
for i in fol_1:
for j in fol_2:
if i == j:
file_1 = open(txt_1 + '\\' + i).read()
file_2 = open(txt_2 + '\\' + j).read()
if file_1 == file_2:
print('Matches')
else:
print('Files didnt match: ' + i)
Есть ли способ игнорировать часть верхнего и нижнего колонтитула на каждой странице
Или есть ли способ игнорировать строку/строку в части нижнего колонтитула/заголовка
Есть ли какие-либо модули Python, которые я должен искать,< br/> Пожалуйста, дайте мне несколько предложений, спасибо!