2009-12-02 2 views
0

Я делаю простые регулярные выражения в Pythonпитона помощь дисплей регулярное выражение результат

Я пытаюсь в re.split, но вещи, как [ «\ г \ п», «\ г \ п»] приходят вместо ответ. Может кто-нибудь, пожалуйста, скажите мне, как отобразить фактический текст, пожалуйста?

Я попытался это заявление:

t_html = re.split("<[a-zA-Z0-9\s\w\W]*>[a-zA-Z0-9\s\w\W]*</[a-zA-Z0-9\s\w\W]*>" ,s) 

БЛАГОДАРЯ

+5

э-э, пожалуйста, опубликуйте регулярное выражение, которое вы * попробовали * использовать. – kwatford

+0

Я пытаюсь получить все HTML-теги и их содержимое ... например, если бы я это: « привет asfasdf» было бы разделить его, как привет и asfasdf Lilz

+2

ли не используйте regex для разбора html. используйте Beautiful Soup www.crummy.com/software/BeautifulSoup –

ответ

0

Если вы хотите использовать регулярное выражение для разбора html, см. here.

0

re.split по самой своей природе расщепляется на шаблон, но не сохраняет его. Если вы хотите вернуть строку, соответствующую шаблону, вы можете поместить круг вокруг шаблона: re.split ((R), string), где R - ваше выражение. Если вы хотите сказать, что найти все совпадающие совпадения, используйте re.findall, который вернет список. См. here для получения более подробной информации и опций.

Смежные вопросы