Существует сайт, который я пытаюсь очистить, который сначала загружает html/js , изменяет поля ввода формы с помощью js, а затем POST. Как я могу получить окончательный вывод html на странице POSTed?сохранить html вывод страницы после выполнения javascript страницы
Я попытался сделать это с помощью phantomjs, но у него есть только возможность рендеринга файлов изображений. Гуглинг вокруг предполагает, что это должно быть возможно, но я не могу понять, как это сделать. Моя попытка:
var page = require('webpage').create();
var fs = require('fs');
page.open('https://www.somesite.com/page.aspx', function() {
page.evaluate(function(){
});
page.render('export.png');
fs.write('1.html', page.content, 'w');
phantom.exit();
});
Этот код будет использоваться для клиента, я не могу ожидать, что он установить слишком много пакетов (nodejs, casperjs и т.д.)
Благодаря
Нужно ли использовать Python? Является ли вариант Java? – OakNinja
Вы также можете получить содержимое страницы с помощью 'document.outerHTML' –