Удаление элементов ‹script› из HTML

Я использую Ruby с модулем Nokogiri и хочу получить содержимое тела без элементов скрипта.

Парсинг Nokogiri использует XPATH или CSS 3.0. XPATH я действительно не понимаю, и я не могу найти селектор CSS для достижения своих целей.


person Community    schedule 30.12.2009    source источник


Ответы (1)


Я не думаю, что такой выбор возможен с XPath.

Я не так хорошо знаком с Ruby или Nokogiri, но на основе ответов на аналогичные вопрос, вы можете попробовать выбрать все элементы скрипта из HTML-документа и удалить их.

doc = Nokogiri::HTML(your_html)
doc.xpath("//script").remove

Отрегулируйте соответственно.

person chlb    schedule 30.12.2009