2016-01-16 9 views
0

В настоящее время я делаю первые шаги с Python & Красивый суп, чтобы очистить данные с сайта статистики России.Скребок данных с Python и Beautiful Soup

Посмотрите на различные примеры здесь, в разделе Переполнение стека, я думаю, что код верен, и все же мой простой запрос ничего не возвращает с этого сайта. При выполнении кода моя командная строка Python остается пустой, но также не возвращает ошибку.

Что здесь не так?

Мой (очень простой) код:

from bs4 import BeautifulSoup 
import urllib2 
url = "http://www.gks.ru/bgd/free/B00_25/IssWWW.exe/Stg/d000/000715.HTM" 
page = urllib2.urlopen(url) 
soup = BeautifulSoup(page.read()) 
print(soup) 
+0

Вместо urllib2, попробуйте использовать 'requests' и простой' requests.get (URL) ' –

+0

код работает для меня – styvane

ответ

3

необходимо указать парсер:

soup = BeautifulSoup(page.read(), 'html.parser') 
+0

* вам нужно указать синтаксический анализатор *. синтаксический анализатор не является обязательным, но подходит для прохождения, поэтому я не думаю, что здесь проблема. Код btw OP работает для меня. – styvane

+0

работает даже без предупреждений, если я задаю синтаксический анализатор – tinySandy

+0

Могу ли я спросить, что вы видите как вывод из функции печати при запуске кода? Я ничего не вижу после этого утверждения печати ... –