Я создаю скребок, который получает основные изображения (на основе Content-Length
прямо сейчас) со страницы. Он проходит через все элементы <img>
и делает запрос HEAD
. Но некоторые страницы, особенно. мобильные, имеют изображения, вставленные после загрузки страницы. Любые идеи о том, как справиться с этим?Скребок страницы после загрузки JS DOM injection
Я пользуюсь node.js
.
Вы должны были бы запустить соответствующие JS на сервере, чтобы повторить то, что эти страницы делают. –
@MarcB: Как запустить соответствующий JS на моем сервере? Есть ли библиотека или я сам писал бы это? Я использую [запрос] (https://github.com/mikeal/request) прямо сейчас. –