Извините, если вопрос глуп, но я не смог найти ответ.объект ответа в scrapy не завершен
Я пытаюсь подготовить скрипт для извлечения данных из веб-сайта с помощью команды «SCRAPY оболочки»:
с помощью веб-браузера, входящего в URL (например, «http://www.testsite.com/data_to_extract»), я получаю данные извлекать. Страница содержит статические данные + динамические данные.
Используя команду «scrapy shell http://www.testsite.com/data_to_extract», а затем выдавая команду («view (response)»), я вижу в веб-браузере статические данные страницы, но не динамические данные.
Я подозреваю, что веб-сервер сначала обслуживает статические данные, а затем заполняет динамические данные на странице. Я предполагаю, что это управляется через javascript на веб-странице.
Если мое понимание верное, то, что должно произойти, заключается в том, что scrapy нужно немного подождать, прежде чем возвращать результат.
Не мог бы кто-нибудь помочь мне здесь?
Спасибо!
Scrapy даст то, что вы можете видеть в команде просмотра «браузер» браузера, не обязательно то, что вы видите, интерпретируемое в окне вашего браузера. Scrapy не понимает Javascript, поэтому не AJAX-вызовы, не магия jQuery ... Так что никаких динамических данных. Вы можете посмотреть активность сети с помощью инструментов разработчика браузера и попытаться имитировать вызовы Javascript/AJAX с помощью нового Scrapy Request() для извлечения дополнительного контента, но может быть трудно подражать реальному браузеру с помощью Scrapy. –
Вы также можете посмотреть https : //github.com/scrapinghub/scrapyjs –