2017-01-11 2 views
0

Я пишу скрипт python, используя красивый суп, где мне нужно получить открывающий тег из строки, содержащей некоторый код HTML.Как получить открывающий и закрывающий тег в красивом супе из строки HTML?

Вот моя строка:

string = <p>...</p> 

Я хочу, чтобы получить <p> в переменной с именем opening_tag и </p> в переменной с именем closing_tag. Я искал документацию, но, похоже, не нашел решение. Может ли кто-нибудь мне это посоветовать?

+0

вы можете получить только имя тега, например, «p» - 'element.name' – furas

ответ

1

Там нет прямого способа получить открытия и закрытие часть тега в BeautifulSoup, но, по крайней мере, вы можете получить name его:

>>> from bs4 import BeautifulSoup 
>>> 
>>> html_content = """ 
... <body> 
...  <p>test</p> 
... </body> 
... """ 
>>> soup = BeautifulSoup(html_content, "lxml") 
>>> p = soup.p 
>>> print(p.name) 
p 

С html.parser хотя вы можете слушать «старт "и" end "тег" события ".

Смежные вопросы