2013-07-26 1 views
2

Я хотел бы получить число внутри вложенного тега. Как мне это сделать?Как получить доступ к span с помощью beautifulSoup?

Мой код выводит это, но я хотел бы получить # 40, а не целых две строки:

<span class="rankings-score"> 
<span>#40</span> 

Вот мой код:

from bs4 import BeautifulSoup 
import requests 
import csv 

site = "http://www.usnews.com/education/best-high-schools/national-rankings/page+2" 

fields = ['national_rank','school','address','school_page','medal','ratio','size_desc','students','teachers'] 

r = requests.get(site) 
html_source = r.text 
soup = BeautifulSoup(html_source) 

table = soup.find('table')  
rows_list = []  

for row in table.find_all('tr'):                                                            

    d = dict() 

    d['national_rank'] = row.find("span", 'rankings-score') 
    print d['national_rank'] 

Я получаю эту ошибку:

AttributeError: 'NoneType' object has no attribute 'span' 

, когда я пытаюсь это:

d['national_rank'] = row.find("span", 'rankings-score').span.text 

ответ

5

доступа текст вложен пролете:

if d['national_rank'] is not None: 
    print d['national_rank'].span.text 

Вы должны убедиться, что на самом деле row.find("span", 'rankings-score') нашел что-то; выше, я тестирую, что там is действительно <span> найдено.

+0

Beat me to it ... Я собирался добавить, что 'class _ = 'rankings-score'' или эквивалент, вероятно, нужен ... В настоящее время, вероятно, больше случайность, которая является результатом ... –

+0

Итак, я пробовал что раньше, а просто сказал: row.find ('span', 'rankings-score'). find ('span'). text и получить атрибут AttributeError: объект «NoneType» не имеет атрибута «content» – goldisfine

+0

@goldisfine: some строки do * not * имеют такой '' span class = "rankings-score"> '. –

Смежные вопросы