Я буду анализировать множество сайтов с различными htmls, и я пытаюсь найти все строки, содержащие определенный текст (внутри html), используя BeautifulSoup.BeautifulSoup найти все вхождения определенного текста
r = requests.get(url)
soup = BeautifulSoup(r.content, "lxml")
for text in soup.find_all():
if "price" in text:
print text
Этот подход не работает (хотя «цена» упоминается более 40 раз в html). Может быть, есть еще лучший подход к этому?
Есть причина, почему вы хотите использовать 'BeautifulSoup' ? Похоже, что если вы просто хотите, чтобы строки, содержащие цену, было проще смотреть напрямую в данные ответа. Какова конечная цель? – Jkdc