HtmlAgilityPack Получить визуализированный HTML

Я использую HTMLAgilityPack и хочу, чтобы документ выглядел так, как он отображается на веб-сайте. Означает, что если элемент html имеет видимость: display:none, я не хочу, чтобы этот узел был в моем документе.

Есть ли способ исключить такие узлы, имеющие visible:none или hidden??

e.g.

<div class="changeodlabel" style="display:none;"><span class="default">Should not be in document html</span></div>
<div class="changeodlabel" ><span class="default">Should be in document html</span></div>

person Sidra Idrees    schedule 05.12.2013    source источник
comment
HTMLAgillityPack анализирует HTML, а не CSS.   -  person Liam    schedule 05.12.2013


Ответы (1)


Html Agility Pack не имеет представления о том, что означают CSS и Javascript, поэтому он просто анализирует HTML и позволяет вам решать, что с ним делать. Если вы хотите, чтобы страница была полностью оценена перед захватом содержимого, вам понадобится более продвинутый парсер HTML. На ум приходит Awesonium. Или вы можете обернуть PhantomJS (ознакомьтесь с исходниками ChutzPah, чтобы узнать, как это можно сделать< /а>).

person jessehouwing    schedule 05.12.2013