Пустое содержимое тега с BeautifulSoup

Я пытаюсь разобрать следующий HTML-страницу:Пустое содержимое тега с BeautifulSoup

http://www.oddsportal.com/soccer/france/ligue-1/results/

для извлечения данных внутри тега "Div ID = tournamentTable", расположенный здесь:

body > div class="wrap" > div id="mother-main" > div id="mother > div id="wrap" > div id="box-top" > div id="box-bottom" > div id="main" > div id="col-left" > div id="col-content" > div id="tournamentTable"

Однако, когда я запускаю следующий код:

f=urllib.request.urlopen("http://www.oddsportal.com/soccer/france/ligue-1/results/") 
html = f.read() 
soup = BeautifulSoup.BeautifulSoup(html, "html.parser") 
soup.find_all("div",id="tournamentTable")

Я ничего не получаю внутри тега div id = "tournamentTable". Я не могу получить данные внутри таблицы: class = "table-main".

Дайте мне знать, если у вас есть решение.

Спасибо!

источник

2016-11-18 MattPer

Данные динамически загружаются браузером с использованием JavaScript, а не напрямую в исходный HTML-код. Используйте селен. –

Расширяясь от того, что сказал Алекс, если вы перейдете на эту страницу и нажмите Ctrl-U, чтобы просмотреть исходный код, вы увидите, что в нем нет ничего в самом html. – user3030010

http://fb.oddsportal.com/ajax-sport-country-tournament-archive/1/OO2KUIR8/X0/1/0/2/?_=1479516929965

вы можете найти вам данные в этой связи, он использует JavaScript для извлечения даты, вы должны попробовать селен!

источник

2016-11-19 01:00:34

Пустое содержимое тега с BeautifulSoup

ответ

Смежные вопросы