2012-05-09 2 views
4

Возможно ли получить исходный код html веб-страницы с curl и запустить javascript-интерпретатор поверх него, поэтому я получаю сгенерированный контент?получить исходный код после выполнения javascript с curl

Страница, которую я должен получить, использует некоторые кодированные и генетические материалы, поэтому я хочу сначала запустить javascript, чтобы получить экранированный и сгенерированный контент ... или мне нужно регулярное выражение javascript и «скомпилировать» javascript самостоятельно? Как

curl <myurl> | perl -ne 'm/unescape\((.*)\)/; print "$1"' | <now to something with that> 

мне известно нет JavaScript двигателя в завиток, но может я просто вызвать другой скрипт/программка, чтобы сделать эту работу?

+0

Попробуйте следующее: http://stackoverflow.com/a/28506533/3063226 – Heitor

ответ

10

Вы можете это сделать, но это более активное участие, чем я думаю, вы понимаете. Ни curl, ни wget не имеют Javascript-движков, поэтому вам понадобится то, что есть.

Я хотел бы начать с просмотра PhantomJS.

+0

славный, я не знал, что там, где такие вещи :) Я также обновляю свой скриншот-скрипт, который в настоящее время проходит через некоторые грани, а затем использует phantomjs! – reox