2015-12-23 5 views
2

Выполнено несколько небольших успешных проектов, которые изо всех сил пытались получить запросы с этого сайта по возрасту - любые советы?Запросы на Python не отвечают

ОБНОВЛЕНИЕ - Хотеться бы, чтобы получить полный красивый запрос супа, чтобы я мог начать соскоб информации из таблиц

from bs4 import BeautifulSoup 
import requests 

r = requests.get("http://www.transfermarkt.co.uk/championship/marktwerte/wettbewerb/GB2") 
soup = BeautifulSoup(r.content,"html.parser") 
print soup 

возвращающегося

<html> 
<head><title>404 Not Found</title></head> 
<body bgcolor="white"> 
<center><h1>404 Not Found</h1></center> 
<hr><center>nginx</center> 
</hr></body> 
</html> 
+0

Что вы хотите, чтобы оно вернулось? (обновите свой вопрос!) (и добро пожаловать в SO!) – user1269942

ответ

1

Вам нужно делать вид, чтобы быть реальным пользователем с браузер и предоставить заголовок User-Agent:

r = requests.get("http://www.transfermarkt.co.uk/championship/marktwerte/wettbewerb/GB2", headers={ 
    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.106 Safari/537.36" 
}) 

Демонстрация:

>>> from bs4 import BeautifulSoup 
>>> import requests 
>>> 
>>> r = requests.get("http://www.transfermarkt.co.uk/championship/marktwerte/wettbewerb/GB2", headers={ 
...  "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.106 Safari/537.36" 
... }) 
>>> soup = BeautifulSoup(r.content,"html.parser") 
>>> print(soup.title.get_text()) 
Top market values 15/16 - Championship - Transfermarkt 
+0

Отлично, спасибо, что познакомил меня с пользовательскими агентами - скоро отметит решение – PythonNoob12345

+0

nice..beat me by whisker! – user1269942

Смежные вопросы