2013-05-28 3 views
1

Я пытаюсь очистить данные с веб-страницы, содержащей некоторые данные, вложенные в теги div.извлечение данных из тегов div Python

url = 'http://london2012.fiba.com/pages/eng/fe/12/olym/p/gid/26/grid/A/rid/9087/sid/6233/game.html' 
boxurl = urllib2.urlopen(url).read() 
soup = BeautifulSoup(boxurl) 

linescoreA = soup.find("div", {"class": "scoreA"}) 

print linescoreA 

выводит это:

<div class="scoreA"> 
<div class="period">19</div> 
<div class="period">22</div> 
<div class="period">22</div><div class="period">26</div> 
<div class="final">89</div> 
<div class="clear"></div> 
</div> 

и где я застрял. Как получить данные из тегов div?

ответ

2

Чтобы получить только текстовые данные, используйте .stripped_strings:

print list(linescoreA.stripped_strings) 
+0

спасибо, казалось, что он должен быть eazy – user2333196

1

Попробуйте

for node in soup.find("div", {"class": "scoreA"}): 
    print ''.join(node.findAll(text=True)) 

и что о

for node in soup.find("div", {"class": "scoreA"}): 
     print node.string 

Я сожалею, я не могу попробовать для вас.

+0

таким образом работает для тегов заголовков, в то время как один выше не делает. – user2333196

Смежные вопросы