Я пытаюсь очистить статистику за столом на этой странице: http://stats.nba.com/teams/traditional/, но я не могу найти html для таблицы. Это в python 2.7.10.Python and Beautiful Soup Web Scraping
from bs4 import BeautifulSoup
import json
import urllib
html = urllib.urlopen('http://stats.nba.com/teams/traditional/').read()
soup = BeautifulSoup(html, "html.parser")
for table in soup.find_all('tr'):
print(table)
Это код, который у меня есть сейчас, но ничего не выводится. Если я попробую это с различными элементами на странице, он отлично работает.
значений таблицы визуализируются с помощью JavaScript, так что вы будете нуждаться в парсер JavaScript для получения значений, в отличие от BeautifulSoup – smoggers
У вас есть рекомендации для синтаксического анализа JavaScript? – johnbowman
Вам действительно не нужно использовать парсер javascript, если вы знаете, откуда взялись данные, в этом случае это http://stats.nba.com/stats/leaguedashteamstats?Conference=&DateFrom=&DateTo=&Division=&GameScope=&GameSegment = & LastNGames = 0 & LeagueID = 00 & Расположение = & MeasureType = Base & Month = 0 & OpponentTeamID = 0 & Результат = & PORound = 0 & PaceAdjust = N & PerMode = PerGame & Period = 0 & PlayerExperience = & PlayerPosition = & PlusMinus = N & Rank = N & Сезон = 2016-17 & SeasonSegment = & SeasonType = Regular + Season & ShotClockRange = & StarterBench = & TeamID = 0 & VsConference = & VsDivision = – Shane