Поисковый робот import.io для нестандартной системы пагинации

Я пытаюсь создать сканер import.io для этого сайта http://theaccelblog.squarespace.com/, но когда я нажимаю «Далее», чтобы перейти к следующей странице для обучения, я возвращаюсь к первой странице из-за используемой системы нумерации страниц. Буду признателен за любые предложения о том, как заставить сканер import.io сканировать эти страницы. Как было предложено на сайте import.io, я попытался найти систему нумерации страниц в пакетах, которыми обмениваются с сервером, но безуспешно. Спасибо, если вы можете помочь. JRH


person JRH    schedule 30.08.2015    source источник


Ответы (1)


Я использовал Bulk Extract для создания API.

https://import.io/data/mine/?id=bc7d67f2-24d3-4b5c-b134-01544430998a

Если вы используете разбиение на страницы со смещением ниже, вы можете ввести его в Bulk и получить нужные вам данные.

http://theaccelblog.squarespace.com/?offset=1418833411427    
http://theaccelblog.squarespace.com/?offset=1409932229141    
http://theaccelblog.squarespace.com/?offset=1402342675828    
http://theaccelblog.squarespace.com/?offset=1397601000000    
http://theaccelblog.squarespace.com/?offset=1397511000000    
http://theaccelblog.squarespace.com/?offset=1390543200000    
http://theaccelblog.squarespace.com/?offset=1375383600000    
http://theaccelblog.squarespace.com/?offset=1359748800000    
http://theaccelblog.squarespace.com/?offset=1285959600000  

Спасибо,
Мег

person Meg Ainsley    schedule 11.09.2015