Я нашел некоторые данные, которые хотел бы извлечь (http://www.education.gov.uk/edubase/public/quickSearchResult.xhtml?page=1), однако мне нужно очистить 1080 страниц, кто-нибудь знает способ очистки нескольких страниц для их <table>
элементов?
Извлечение данных с нескольких страниц
comment
есть предпочтения по языку? Scrapy — хороший фреймворк на Python для подобного парсинга (doc.scrapy.org/en /latest/index.html)
- person paul trmbrth   schedule 18.07.2013
comment
Предпочтительно PHP, но это не имеет большого значения, пока я могу получить данные
- person Nathan Dunn   schedule 18.07.2013
Ответы (1)
Я думаю, вы хотите попробовать веб-скрапинг IRobotSoft. Это бесплатно и предоставляет визуальные интерфейсы. Сначала ознакомьтесь с демонстрацией на странице http://www.irobotsoft.com/help/. Их форум также очень полезен.
person
seagulf
schedule
19.07.2013