2015-06-10 2 views
0

Я пытаюсь создать базовую программу для поиска Google. Первый шаг доступа к веб-странице Google для результатов, для которых я использую:Google redirects запрос запроса 503 ошибка

http://google.com/search?q=something+somethang 

С «что-то что-то», являющегося запрос. Что я получаю от журналирования информации является то, что я перенаправлен на:

2015-06-10 13:08:36,815 - INFO - Starting new HTTP connection (1): google.com 
2015-06-10 13:08:37,487 - DEBUG - "GET /search?q=something+somethang HTTP/1.1" 302 359 
2015-06-10 13:08:37,601 - INFO - Starting new HTTP connection (1): ipv4.google.com 
2015-06-10 13:08:37,750 - DEBUG - "GET /sorry/IndexRedirect?continue=http://google.com/search%3Fq%3Dsomething%2Bsomethang&q=CGMSBJgH4AYYzN_hqwUiGQDxp4NLfKUWBsQJL2TkqfCe8pFtltJvTB0 HTTP/1.1" 503 2659 
2015-06-10 13:08:37,831 - DEBUG - 503 

В последней строке я напечатал, это status_code для запроса.

Я проверил ссылку:

google.com/sorry/IndexRedirect?continue=http://google.com/search%3Fq%3Dsomething%2Bsomethang&q=CGMSBJgH4AYYzN_hqwUiGQDxp4NLfKUWBsQJL2TkqfCe8pFtltJvTB0 

и это проверить для ботов и прочее. Нет ли способа заставить программу работать?

Бест,

+0

Скремблирование результатов поиска в Google не соответствует их [ToS] (http://www.google.com/intl/ru/policies/terms/), поэтому вы блокируетесь. Вы все еще можете использовать [API веб-поиска] (https://developers.google.com/web-search/docs/), но он устарел в 2010 году. –

ответ

0

кажется, какой бы метод вы используете для извлечения веб-страницы Не должно следовать переадресации установлен в True.

должно работать -

import requests 
r = requests.get('http://google.com/search?q=something+somethang') 
print r.status_code 
print r.content 

Вам также может понадобиться отправить заголовок строки в User-Agent.