Я пытаюсь разобрать страницаBeautifulSoup не разборе мимо тега заголовка
http://gwyneddathletics.com/custompages/sport/mlacrosse/stats/2014/ml0402gm.htm
и когда я пытаюсь FindAll («б») я не получаю никаких результатов, то же самое с 'тр. Я не могу найти ничего, кроме исходного тега заголовка.
Кроме того, когда я делаю суп = BeautifulSoup (разметку) и напечатать суп, я получаю всю страницу с дополнительным в конце выхода
Я использую Python 2.6 с BeautifulSoup 3.2.0. Почему мой суп не разбирает страницу правильно?
Вы можете поделиться кодом, который используете для чтения содержимого? –
req = urllib2.Request (url) response = urllib2.urlopen (req) markup = response.read() –