Мне нужно, чтобы загрузить следующую страницу: http://m.10bet.com/#leage_panel#10096сайта выскабливание: Ждать, пока сайт не будет загружен укомплектовать
Это страница букмекера и мне нужны кавычки. Итак, в первую очередь это кажется довольно простым. Однако, вот что происходит (вы можете проверить это с помощью, например, разработчик инструментов вашего браузера.):
- Откройте URL
- страница загружает первоначальный HTML, который впоследствии вызывающий запрос Ajax для получения котировки
- Однако цитата содержится в json, но они обструкционированы таким образом, что невозможно просто проанализировать их непосредственно из вызова ajax. Кроме того, JavaScript просматривается на веб-странице. Поэтому нет возможности напрямую читать цитаты из запроса.
Вместо этого мне нужно будет использовать безгласный браузер, способный оценивать javascript. HtmlUnit для java неадекватен, поскольку он не предлагает надежную функциональность javascript. Поэтому PhantomJS в сочетании с CasperJS - мой текущий выбор. Я применяю CasperJS со следующим сценарием:
var casper = require('casper').create();
casper.start('http://m.10bet.com/#leage_panel#10096', function() {
var url = 'http://m.10bet.com/#leage_panel#10096';
this.download(url, '10bet.html');
});
casper.run(function() {
this.echo('Done.').exit();
});
Однако этот скрипт не загружает полную страницу. Просто встроенная страница. Как загрузить полную веб-страницу, как она представлена в браузере?
Я не знаком с этими инструментами, но можете ли вы прикрепить свой код к событию 'domready'? Это может сделать это. – halfer