2015-03-31 3 views
1

Я хочу получить содержимое страницы html с URL-адреса с помощью Node JS после того, как JavaScript полностью загружен или получить базовый html, а затем запустить все файлы JavaScript для достижения конечного контента. Например, предположим, что существует сайт на основе Angular JS, поэтому базовый html прост, но после загрузки всех кодов JavaScript на странице содержимое страницы совершенно иное. Я хочу получить этот окончательный контент на своем сервере, чтобы найти что-то в нем. Есть идеи?Узел JS получает полностью загруженную страницу html

+2

Вам нужно что-то вроде [PhantomJS] (http://phantomjs.org/), чтобы сделать это , На ней есть много оберток. –

+0

Возможный дубликат [Как очистить страницы с динамическим контентом с помощью node.js?] (Http://stackoverflow.com/questions/28739098/how-can-i-scrape-pages-with-dynamic-content-using-using- узел-JS) – Quentin

ответ

1

After-Load представляет собой пакет NodeJS, который работает как шарм:

var afterLoad=require('after-load'); 

затем:

afterLoad('http://stackoverflow.com/questions/29366718',function(html){ 

     console.log(html.indexOf('charm')>0); 
     //true 
})