2015-07-02 5 views
1

Я новичок в Scrapy, и я просто пытался соскрести http://www.diseasesdatabase.com/Scrapy вид возвращает пустую страницу

Когда я типа scrapy view http://www.diseasesdatabase.com/, он отображает пустую страницу, но если загрузить страницу и сделать это на локальном файле , он отображается как обычно. Почему это происходит?

ответ

2

прикидываться реальный браузер обеспечивает User-Agent заголовок:

scrapy view http://www.diseasesdatabase.com/ -s USER_AGENT="Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.130 Safari/537.36" 

работал для меня.

Обратите внимание, что опция -s здесь помогает переопределить встроенный USER_AGENT setting.

+0

Все хорошо и хорошо, но я все равно хотел бы знать, почему он возвращает пустую страницу. –

+1

+1. Просто, я думаю, что ** scrapy ** действительно должен помещать это как первую страницу примечания в свои документы. Просто, что многие люди впали в это и задали этот похожий вопрос ха-ха. – Anzel

+0

@RahulSarma, потому что эти сайты проверяют заголовок User-Agent, как, скорее всего, метод анти-веб-скрепок. – alecxe

Смежные вопросы