У меня есть следующие подстроки в строке Str (DList):Работа с « п т т» с регулярным выражением
"addressRegion">\n\t\t\t\t\t\t\t\t\tMA\n\t\t\t\t\t\t\t\t</span>
Я пытаюсь использовать re.search вытащить «МА» с помощью это:
state = re.search(r'"addressRegion">\n\t\t\t\t\t\t\t\t\t(.+?)\n\t',str(dList))
Однако, это не работает. Я понимаю, что это возможно из-за способа обработки «/». Я не могу понять, как с этим бороться.
Вы используете регулярное выражение для разбора HTML? [Пожалуйста, не надо] (http://stackoverflow.com/a/1732454/2308683) –
Я использую BeautifulSoup, я использую регулярное выражение для более тонких деталей. (подстроки). – krthkskmr
Можете ли вы получить текст внутри этого тега span? Затем разделите пробелы '\ t' и' \ n'? –