2014-11-16 6 views
0

Я использую Python и BeautifulSoap для соскабливанияскоблить сек SPAN на основе пользовательского атрибута - BeautifulSoap

У меня есть HTML-разметку, и я хочу, чтобы извлечь Rated 3.4 Out of 5 by 623 reviewers

<span itemprop="aggregateRating" itemscope="" itemtype="http://schema.org/AggregateRating"> 
    Rated 
    <span itemprop="ratingValue"> 
     3.4</span> 
    out of 
    <span itemprop="bestRating">5</span> 
    by 
    <span itemprop="reviewCount"> 
     623 
    </span> 
    reviewers. 
</span> 

Я использовал, чтобы сделать это с помощью CSS селекторов, как soup.select("div.myclass").text, но понятия не имею, как это сделать?

ответ

0
print soup.find("span",{"itemprop":"aggregateRating"}).text 

Out[]: 

Rated 

     3.4 
    out of 
    5 
    by 

     623 

    reviewers. 

приятнее версия будет,

print soup.find("span",{"itemprop":"aggregateRating"}).text.replace('\n','') 

Out[]: 

Rated    3.4 out of  5 by    623  reviewers 
Смежные вопросы