Как получить весь текст внутри тегов «td» из тега «table» на странице html с помощью драгоценного камня Mechanize?

Я пытаюсь разобрать таблицу с помощью драгоценного камня Mechanize, но я не знаю, как перебирать таблицу.


person user633230    schedule 24.11.2010    source источник


Ответы (1)


Mechanize использует nokogiri для синтаксического анализа HTML, поэтому вам следует поискать там документацию. А именно, взгляните на метод xpath.

Вот пример анализа текущей страницы:

require 'open-uri'
require 'nokogiri'
doc = Nokogiri::HTML(open('http://stackoverflow.com/questions/4265745/how-to-get-all-text-inside-td-tags-from-table-tag-on-html-page-using-mechaniz'))
table = doc.xpath('//table').first # getting the first table on the page
table.xpath('tr/td').count # getting all the td nodes right below table/tr and counting them
#=> 4
person Mladen Jablanović    schedule 24.11.2010