Я выскабливание сайт, который имеет очень плохую структуру HTML, и я получаю текст как этотЗаменить только четные вхождения re.sub() - Python Regex
Пример:
Creator:
\r\r
My Name
\r\r
Date created:
\r\r
123123
<br><br>
Title:
\r\r
Title here
\r\r
Я хочу это выглядеть
Creator: My Name
\r\r
Date created:123123
Title:Title here
\r\r
у меня есть это регулярное выражение _str = re.sub('\r+','',_str)
Но я знаю, что его неправильно, потому что он заменяет все \r
Есть ли способ перебрать более re.sub()
? Или вы имеете в виду, как мне достичь своей цели?
Попробуйте _str = re.sub ('([^ \ г] +) \ r \ r ([^ \ r] + \ r \ r) ',' \\ 1 \\ 2 ', _str) – Skycc
Проверьте это релевантное сообщение http://stackoverflow.com/a/1732454/131057 –