HTML, выглядит следующим образом:Как извлечь html с beautifulsoup4?
<td class='Thistd'><a ><img /></a>Here is some text.</td>
Я только хочу, чтобы получить строку в <td>
. Мне не нужен <a>...</a>
. Как я могу это сделать?
Мой код:
from bs4 import BeautifulSoup
html = """<td class='Thistd'><a><img /></a>Here is some text.</td>"""
soup = BeautifulSoup(html)
tds = soup.findAll('td', {'class': 'Thistd'})
for td in tds:
print td
print '============='
Что я получаю <td class='Thistd'><a ><img /></a>Here is some text.</td>
Но мне просто нужно Here is some text.
чем разница между тем, что вы получили, и что вы хотите – The6thSense
извините, есть некоторые ошибки, исправленные сейчас. –