У меня есть куча веб-страниц, которые я хотел бы просмотреть с помощью скрипта и получить все содержимое. Я знаю, что ссылка является 18-й ссылкой на каждой странице. У меня есть следующий код в качестве теста, чтобы просто один раз перейти по ссылке и очистить экран:
use strict;
use WWW::Mechanize;
my $start = "http://*some-webpage*";
my $mech = WWW::Mechanize->new( autocheck => 1 );
$mech->get( $start );
open(Output, ">mech_test.txt") or die $!;
$mech->follow_link(url_regex => qr//, n => 18 );
print Output $mech->response()->content();
close(Output);
К сожалению, ссылка, к которой я пытаюсь получить доступ, не имеет ничего в теге href. Просмотр источника страницы по ссылкам выглядит так:
<a href="" onclick="return _doClick('CA256D6E001A7020.80376e858b0791b1ca256d7300098304/$Body/0.155A', this, null)">Next >></a>
Я считаю, что это javascript, и механизация не может перейти по этой ссылке. Любые идеи, чтобы обойти это?