Я использую Ruby с модулем Nokogiri и хочу получить содержимое тела без элементов скрипта.
Парсинг Nokogiri использует XPATH или CSS 3.0. XPATH я действительно не понимаю, и я не могу найти селектор CSS для достижения своих целей.
Я использую Ruby с модулем Nokogiri и хочу получить содержимое тела без элементов скрипта.
Парсинг Nokogiri использует XPATH или CSS 3.0. XPATH я действительно не понимаю, и я не могу найти селектор CSS для достижения своих целей.
Я не думаю, что такой выбор возможен с XPath.
Я не так хорошо знаком с Ruby или Nokogiri, но на основе ответов на аналогичные вопрос, вы можете попробовать выбрать все элементы скрипта из HTML-документа и удалить их.
doc = Nokogiri::HTML(your_html)
doc.xpath("//script").remove
Отрегулируйте соответственно.