Используя phantomjs, вы можете получить доступ к копии модифицированного DOM, после разбора. Используя вызов cURL, вы можете получить доступ к предварительному анализу страницы. В предварительно проанализированном коде вы можете найти ошибки, которые исправляются браузером.Как получить доступ к неизменному источнику страницы через phantomjs
Как вы получаете доступ к изменениям, сделанным после рендера, и к предварительно подготовленному контенту, чтобы сопоставить исправления, которые делает браузер автоматически?
Является лучшим методом для использования DIFF в двух файлах или фантомы содержат две копии содержимого, оригинальные и модифицированные формы? Я не могу найти правильный способ выразить это, чтобы получить ответ через google и поиск здесь: https://stackoverflow.com/search?q=[phantomjs]+save+unaltered+source не получил никаких результатов.
Я хотел бы избежать второго вызова той же страницы по причинам пропускной способности/эффективности.
Вероятно, не представляется возможным http://stackoverflow.com/questions/24069722/can-i-get-the-original-page-source -vs-current-dom-with-phantomjs-casperjs –
Я бы прочитал этот пост, но я подумал, что речь идет о JS-модификации DOM. Я менее обеспокоен изменением JS и больше обеспокоен тем, закрывает ли браузер открытые теги или сокращает до . Например, я знаю, что есть возможность вытащить копию в браузере, но это модифицированная копия. С этой должности все еще неясно, возможно ли это или нет для этой цели. – MyStream
Вы имеете в виду, что на проводе. Нет, нет способа получить это в PhantomJS, но вы можете сделать запрос ajax, чтобы просто получить страницу снова. –