Я хотел бы извлечь данные между тегами span. Вот пример кода HTML:извлечение данных между тегами span с помощью BeautifulSoup Python
<p>
<span class="html-italic">3-Acetyl-</span>
<span class="html-italic">(4-acetyl-5-(β</span>
"-"
<span class="html-italic">naphtyl)-4,5-dihydro-1,3,4-oxodiazol-2-yl)methoxy)-2H-chromen-2-one</span>
"("
<b>5b</b>
</p>
Мне нужно, чтобы получить полное имя:
3-Acetyl-4-acetyl-5-(β-naphtyl)-4,5-dihydro-1,3,4-oxodiazol-2-yl)methoxy)-2H-chromen-2-one
(без 5б). Я не знаю, как извлечь '-' между вторым и третьим тегами span. Кроме того, общее количество тегов span может варьироваться, а «-» может быть между любыми тегами span. Код, который я написал дает мне только: 3-ацетил-4-ацетил-5- (β Вот часть моего кода:.!
p = soup.find("p")
name = ""
for child in p.children:
if child.name == "span":
name += child.text
print name
Любая помощь высоко ценится
Это пропускающей '«-». 'вне пролеты (должны быть β-нафтилом). –