2016-09-21 3 views
1

на сайте, что я пытаюсь разобрать теги, такие как:BeautifulSoup: Как извлечь контент?

<a class="sku" href="http://pl.farnell.com/tdk/c3225x6s0j107m250ac/capacitor-mlcc-x6s-100uf-6-3v/dp/2526286" title="2526286">2526286</a> 

Я хотел бы получить список их содержания (здесь 2526286 значение). Как я могу это сделать? Я пробовал с

for node in soup.find_all('a', {'class': 'sku'}): 
print(node.content) 

но он возвращает «Нет» для каждого найденного тега.

+1

'Используйте node.text' или нода [ "название"]' –

ответ

2

Вы можете использовать:

for node in soup.find_all('a', {'class': 'sku'}): 
    print(node.string) 

Как весь код:

from bs4 import BeautifulSoup 

string = """ 
<div> 
    <a class="sku" href="http://pl.farnell.com/tdk/c3225x6s0j107m250ac/capacitor-mlcc-x6s-100uf-6-3v/dp/2526286" title="2526286">2526286</a> 
</div> 
""" 
soup = BeautifulSoup(string, "lxml") 
for node in soup.find_all('a', {'class': 'sku'}): 
    print(node.string) 
+0

отлично работает! Благодаря! – bLAZ

Смежные вопросы