Мне нужна помощь со следующим шаблоном, я боюсь много часов. У меня есть текст, как:Текст между совпадением шаблонов RegEx Python
<<12/24/2015 00:00 userrrr>>
********** Text all char and symbols ************
<<12/24/2015 00:00 CET userr>>
Text all char and symbols
<<12/24/2015 00:00 GMT+1 userrrr>> Text in same line
<<12/24/2015 00:00 CET userrr>>
Text all characters and symbols
<<12/24/2015 00:00 GMT+1 userrrrrrr>> Text in same line
More Text all characters and symbols
<<12/24/2015 00:00 CET userrrrr>>
More text all characters and symbols
<<12/24/2015 00:00 CET userrrrrrrrrrr>>
More Text all characters and symbols
с помощью шаблона:
(\<<)(\d{2}/\d{2}/\d{4}\s\d{2}:\d{2})(.*?(?=>>))(>>)
даты и времени, и все между стрелками подобран correctly.Unfortunately, я не могу найти способ извлечь текст между группами конечных patterns.The должен выглядеть (left_arrows), (DateTime), (пользователь), (RIGHT_ARROWS), (текст) .Отель ближе я был с помощью:
(\<<)(\d{2}/\d{2}/\d{4}\s\d{2}:\d{2}\s\D{3}.*?(?=\s))\s(.*?(?=>>))(>>)((?s).*?(?=<<\d{2}/\d{2}))
Но это не соответствует первому и последнему правильно. Click Here to check the result(pythex.org)
Что вы хотите извлечь? Вы уверены, что 'line.startswith (" << ")' не может выполнить большую часть того, что вы хотите? –
3 группы (datetimeoffset), (Пользователь), (Текст между pattterns). Так что теперь я не могу извлечь текст между шаблонами. У меня нет проблем с первыми 2 группами. – Zars
Почему это помечено 'BeautifulSoup'? .. – alecxe