Требуется решение для уничтожения таких узлов, как <footer>foobar</footer>
и <div class="nav"></div>
, из нескольких файлов HTML.
Я хочу сбросить сайт на диск без меню и нижних колонтитулов и прочего. В идеале я бы выполнил эту задачу, используя базовые инструменты unix, такие как sed. Поскольку это не XML, я не могу использовать xmlstarlet
.
Может ли кто-нибудь предложить рецепты, так что в идеале я могу иметь скрипт, работающий kill-node.sh 'div class="toplinks"' *.html
, чтобы обрезать кусочки, которые мне не нужны. Спасибо,
tidy
? Мне не нравится tidy, поскольку он не поддерживает HTML5 и требует как минимум получаса безумного переключения, чтобы получить что-то разумное. - person hendry   schedule 03.05.2010