У меня есть HTML-страница, в которой перечислены длинные индексы тем и номеров страниц. Я хочу найти все номера страниц и их ссылки на теги привязки и уменьшить номера страниц на 1
.
Вот пример строки в HTML:
<p class="index">breakeven volume (BEV), <a href="ch02.xhtml#page28">28</a></p>
Я пытаюсь найти число 28
в обоих местах и уменьшить его на 1
.
Пока мне удалось найти число и заменить его самим собой, но я не могу понять, как его уменьшить. Мой код до сих пор:
import fileinput
import re
for line in fileinput.input():
line = re.sub(r'\>([0-9]+)\<', r'>\1<', line.rstrip())
print(line)