Предположим, что у меня есть следующие html
:Исключить элемент из веб-Царапины Loop
<h4>
<a href="http://www.google.com">Google</a>
</h4>
<h4>Random Text</h4>
Я в состоянии идентифицировать все h4
заголовки с помощью цикла, такие как:
for url in soup.findAll("h4")
print(url.get_text())
И что работает хорошо, за исключением он включает элемент «случайный текст» в заголовке h4
. Можно ли программно удалить вхождения заголовков h4
, которые не соответствуют определенным критериям - например, те, которые не содержат ссылки?
Или 'если url.a: печать (url.get_text())' –