Как просмотреть результаты разбиения на страницы с помощью PHP/Curl?

Скажем, например, я хотел получить результаты с первых 3 страниц в Google. Так что в основном я хочу 30 лучших результатов. Я могу захватить первые 10 на странице 1, но как мне сказать Curl, что после того, как первая страница будет готова, «щелкнуть» вторую страницу и так далее?


person Keith Donegan    schedule 18.07.2009    source источник


Ответы (1)


Просто внимательно посмотрите на URL-адреса:

Первая страница:

http://www.google.com/search?q=lmgtfy

Вторая страница:

http://www.google.com/search?q=lmgtfy&start=10
person deceze♦    schedule 18.07.2009
comment
идеально подходит для моего примера! - но допустим, что в любом другом сценарии ссылки на страницы были неясными, и вы не могли увеличить значение. Можно ли заставить Curl щелкнуть на другой странице? - person Keith Donegan; 18.07.2009
comment
На этот вопрос нет общего ответа, скриншоты — это всегда индивидуальная работа. Однако в 99,99% случаев некоторые параметры URL просто увеличиваются для каждой страницы. Google использует &start=xx, другие могут использовать &page=x, третьи /offset:x/ или что-то еще. Просто проанализируйте различия между первой, второй и третьей страницами, и вы, как правило, довольно быстро во всем разберетесь. - person deceze♦; 18.07.2009