Я пытаюсь создать сканер import.io для этого сайта http://theaccelblog.squarespace.com/, но когда я нажимаю «Далее», чтобы перейти к следующей странице для обучения, я возвращаюсь к первой странице из-за используемой системы нумерации страниц. Буду признателен за любые предложения о том, как заставить сканер import.io сканировать эти страницы. Как было предложено на сайте import.io, я попытался найти систему нумерации страниц в пакетах, которыми обмениваются с сервером, но безуспешно. Спасибо, если вы можете помочь. JRH
Поисковый робот import.io для нестандартной системы пагинации
Ответы (1)
Я использовал Bulk Extract для создания API.
https://import.io/data/mine/?id=bc7d67f2-24d3-4b5c-b134-01544430998a
Если вы используете разбиение на страницы со смещением ниже, вы можете ввести его в Bulk и получить нужные вам данные.
http://theaccelblog.squarespace.com/?offset=1418833411427
http://theaccelblog.squarespace.com/?offset=1409932229141
http://theaccelblog.squarespace.com/?offset=1402342675828
http://theaccelblog.squarespace.com/?offset=1397601000000
http://theaccelblog.squarespace.com/?offset=1397511000000
http://theaccelblog.squarespace.com/?offset=1390543200000
http://theaccelblog.squarespace.com/?offset=1375383600000
http://theaccelblog.squarespace.com/?offset=1359748800000
http://theaccelblog.squarespace.com/?offset=1285959600000
Спасибо,
Мег
person
Meg Ainsley
schedule
11.09.2015