2016-01-26 2 views
0

Я схожу с этого site и ищу примеры кода, которые помогут мне выяснить, как получить информацию внутри этого элемента управления JSP (это намного сложнее, чем с обычным текстом!). Кажется, я ничего не вижу в заголовках HTTP. Вот мой код:Скремблирование содержимого JS сайта с использованием perl

my $mech_r = new WWW::Mechanize(); 

my $uri = 'http://global.krx.co.kr/contents/GLB/02/0203/0203000000/GLB0203000000.jsp'; 
print "Getting '$uri'\n"; 
my $page = $mech_r->get($uri); 

print "Parsing data..."; 
my $root = HTML::TreeBuilder->new_from_content($mech_r->content()); 

my ($news_table) = $root->look_down(
    sub { 
     defined($_[0]->tag()) and 
     $_[0]->tag() eq 'ul' and 
     defined($_[0]->attr('class')) and 
     $_[0]->attr('class') eq 'board-list' 
    } 
); 

if (!defined($news_table)) { 
    print Dumper($root); 

    croak "Could not get the news table"; 
} 

Я хотел бы получить название, дату и ссылку.

Но не получает никаких данных, поскольку он загружается javascript.

ответ

2

Как указано, WWW::Mechanize не обрабатывает JavaScript. Попробуйте WWW::Mechanize::Firefox, WWW::Scripter, WWW::Selenium, WWW::Mechanize::PhantomJS или аналогичный.

+0

им пытаются Selenium, но я застрял на котором запущен сервер >> Java -jar Селен-сервера автономный-2.44.0.jar 03: 05: 27,879 INFO - Started org.openqa.jetty.jetty. Сервер @ 2a5330 – BashingPerl

Смежные вопросы