Синтаксический HTML в Beautiful Soup

Я пытаюсь разобрать фрагменты HTML, как это:Синтаксический HTML в Beautiful Soup

<div><span>adrress</span>text of address</div>

Как я могу взять фрагмент «текст адреса» без программно тег диапазона в Beatiful суп?

Теперь я беру все содержимое DIV и удалить срок, но я думаю, что есть лучший способ

источник

2013-06-19 kharandziuk

можно использовать regexp? – tanaydin

@tanaydin regexp и html не идут вместе. – kingdamian42

>>> fragment = '<div><span>adrress</span>text of address</div>' 
>>> soup = BeautifulSoup(fragment) 
>>> soup.div.span.nextSibling 
u'text of address'

источник

2013-06-19 14:03:13 falsetru

вот как:

>>> from BeautifulSoup import BeautifulSoup 
>>> text = "<div><span>address</span>text of address</div>" 
>>> print BeautifulSoup(text).find('div').contents[-1] 
text of address

Извините за мой первый ответ, я неправильно понял вопрос.

источник

2013-06-19 13:59:43 zmo

Синтаксический HTML в Beautiful Soup

ответ

Смежные вопросы