2014-09-08 3 views
25

У меня есть следующий объект BS4 список:Как получить HTML от красивого объекта супа

>>> listing 
<div class="listingHeader"> 
<h2> 
.... 


>>> type(listing) 
<class 'bs4.element.Tag'> 

Я хочу, чтобы извлечь сырой HTML в виде строки. Я пробовал:

>>> a = listing.contents 
>>> type(a) 
<type 'list'> 

Так что это не сработает. Как я могу это сделать?

ответ

44

Просто получить string representation:

html_content = str(listing) 

Это не-prettified версия.

Если вы хотите prettified один, использовать prettify() метод:

html_content = listing.prettify() 
+1

Есть ли способ, чтобы превратить его в юникод строку я получаю сообщение об ошибке: «WebDriverException: Сообщение: u'missing, перед постановкой '" – user61629

+2

@ user61629 yup, вы можете использовать' unicode (listing) '. – alecxe

Смежные вопросы