У меня есть скрипт Python, который будет просматривать HTML-файл следующего формата:
<DOC>
<HTML>
...
</HTML>
</DOC>
<DOC>
<HTML>
...
</HTML>
</DOC>
Как удалить все теги HTML (заменить теги на ''), за исключением открывающих и закрывающих тегов DOC с использованием регулярных выражений в Python? Кроме того, если я хочу сохранить альтернативный текст тега, как должно выглядеть регулярное выражение?