Извлечение данных с нескольких страниц

Я нашел некоторые данные, которые хотел бы извлечь (http://www.education.gov.uk/edubase/public/quickSearchResult.xhtml?page=1), однако мне нужно очистить 1080 страниц, кто-нибудь знает способ очистки нескольких страниц для их <table> элементов?


person Nathan Dunn    schedule 18.07.2013    source источник
comment
есть предпочтения по языку? Scrapy — хороший фреймворк на Python для подобного парсинга (doc.scrapy.org/en /latest/index.html)   -  person paul trmbrth    schedule 18.07.2013
comment
Предпочтительно PHP, но это не имеет большого значения, пока я могу получить данные   -  person Nathan Dunn    schedule 18.07.2013


Ответы (1)


Я думаю, вы хотите попробовать веб-скрапинг IRobotSoft. Это бесплатно и предоставляет визуальные интерфейсы. Сначала ознакомьтесь с демонстрацией на странице http://www.irobotsoft.com/help/. Их форум также очень полезен.

person seagulf    schedule 19.07.2013