Я схожу с этого site и ищу примеры кода, которые помогут мне выяснить, как получить информацию внутри этого элемента управления JSP (это намного сложнее, чем с обычным текстом!). Кажется, я ничего не вижу в заголовках HTTP. Вот мой код:Скремблирование содержимого JS сайта с использованием perl
my $mech_r = new WWW::Mechanize();
my $uri = 'http://global.krx.co.kr/contents/GLB/02/0203/0203000000/GLB0203000000.jsp';
print "Getting '$uri'\n";
my $page = $mech_r->get($uri);
print "Parsing data...";
my $root = HTML::TreeBuilder->new_from_content($mech_r->content());
my ($news_table) = $root->look_down(
sub {
defined($_[0]->tag()) and
$_[0]->tag() eq 'ul' and
defined($_[0]->attr('class')) and
$_[0]->attr('class') eq 'board-list'
}
);
if (!defined($news_table)) {
print Dumper($root);
croak "Could not get the news table";
}
Я хотел бы получить название, дату и ссылку.
Но не получает никаких данных, поскольку он загружается javascript.
им пытаются Selenium, но я застрял на котором запущен сервер >> Java -jar Селен-сервера автономный-2.44.0.jar 03: 05: 27,879 INFO - Started org.openqa.jetty.jetty. Сервер @ 2a5330 – BashingPerl