Я новичок в python. Я хочу сохранить каждый тег HTML в элемент списка.Разбор HTML-тегов с использованием python
from bs4 import BeautifulSoup
text = """
<body>
<div class="product">
<div class="x">orange</div>
<div class="x">apple</div>
<p> This is text </p>
</div>
</body>"""
soup = BeautifulSoup(text)
y=[]
for i in (soup.find_all("div", class_="product")):
y.append(i.get_text().encode("utf-8").strip())
Из приведенного выше кода длина y равна 1 и сохраняет весь текст по одному элементу списка. Тем не менее, необходимо проанализировать использование «div-продукта» и сохранить каждый текст внутри тега html в другой элемент списка.
Так что у будет:
y =['orange', 'apple', 'This is text']
вместо:
y=['orange\napple\n This is text']