Моя проблема заключается в разборе веб-сайта, а затем при загрузке дерева данных с помощью BS. Как я могу найти содержимое тега <em>
? Я пробовалPython BeautifulSoup не может выбрать конкретный тег
for first in soup.find_all("li", class_="li-in"):
print first.select("em.fl.in-date").string
#or
print first.select("em.fl.in-date").contents
но он не работает. Помощь Pls.
Я ищу автомобили на tutti.ch
Вот весь мой код:
#Crawl tutti.ch
import urllib
thisurl = "http://www.tutti.ch/stgallen/fahrzeuge/autos"
handle = urllib.urlopen(thisurl)
html_gunk = handle.read()
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_gunk, 'html.parser')
for first in soup.find_all("li", class_="li-in"):
if first.a.string and "Audi" and "BMW" in first.a.string:
print "Geschafft: %s" % first.a.contents
print first.select("em.fl.in-date").string
else:
print first.a.contents
Когда он находит БМВ или Ауди он должен проверить, когда был включен автомобиль. Время находится в эм-Tag, как это:
<em class="fl in-date"> Heute <br></br> 13:59 </em>
Благодарю вас так много Адама Барнса. Ваш код работает отлично! –
'и« Audi »' всегда будет True –