Я пытаюсь разобрать таблицу с помощью драгоценного камня Mechanize, но я не знаю, как перебирать таблицу.
Как получить весь текст внутри тегов «td» из тега «table» на странице html с помощью драгоценного камня Mechanize?
Ответы (1)
Mechanize использует nokogiri
для синтаксического анализа HTML, поэтому вам следует поискать там документацию. А именно, взгляните на метод xpath
.
Вот пример анализа текущей страницы:
require 'open-uri'
require 'nokogiri'
doc = Nokogiri::HTML(open('http://stackoverflow.com/questions/4265745/how-to-get-all-text-inside-td-tags-from-table-tag-on-html-page-using-mechaniz'))
table = doc.xpath('//table').first # getting the first table on the page
table.xpath('tr/td').count # getting all the td nodes right below table/tr and counting them
#=> 4
person
Mladen Jablanović
schedule
24.11.2010