Я использую lxml.html для анализа содержимого html. Но я не понимаю, почему lxml отбрасывает атрибуты тега «тело». Пробовал использовать как lxml.html.parse, так и lxml.html.document_fromstring, как предложено здесь
Но все же это не работает.
Пример html-строки: -
<html class="hello"> <head> <iframe src="index.html"></iframe> </head> <body class="foo"><h1>a</h1></body> </html>
Кто-нибудь еще сталкивался с этой проблемой?