Я работаю над программой очистки веб-страниц, но у меня возникла проблема с использованием scrapy с созданным javascript контентом. Я знаю, что scrapy не построен для этого типа скребков, но я пытался использовать scrapyjs или splash, чтобы выполнить то, что мне нужно.Как интегрировать модуль рендеринга javascript в scrapy?
Однако, я не могу заставить любой из этих двух модулей правильно работать со скрипом. Мой вопрос: если у кого-то есть минимальный пример, он может показать, что использует scrapyjs или всплеск для рендеринга javascript-страниц?
Редактировать: Моя платформа ubuntu и я работаем с python. Для scrapyjs я просто помещаю исходный код в самый верхний каталог проекта scrapy, и мне еще предстоит найти какие-нибудь реальные руководства о том, как использовать всплеск. Причина, по которой я спрашиваю о всплеске, состоит в том, что она кажется более мощным модулем для рендеринга javascript и много упоминается в том же разговоре, что и scrapjs.
Что ваша платформа, как вы установили scrapyjs или всплеск? Какие ошибки, если таковые имеются, вы получаете? –