У меня есть некоторые текстовые данные следующим образом.Объяснение для сложного регулярного выражения
{"Timestamp": "Tue Apr 07 00:32:29 EDT 2015",Title: Indian Herald: India's Latest News, Business, Sport, Weather, Travel, Technology, Entertainment, Politics, Finance <br><br>Product: Gecko<br>CPUs: 8<br>Language: en-GB"}
С текстом ниже, я извлекая название только (Indian Herald: India's Latest News, Business, Sport, Weather, Travel, Technology, Entertainment, Politics, Finance
), используя следующее регулярное выражение:
appcodename = re.search(r'Title: ((?:(?!<br>).)+)', message).group(1)
Я пытаюсь понять, как работает над регулярным выражением.
(?!<br>)
является отрицательным опережением для <br>
(?:(?!<br>).)+)
- что это значит? Может кто-то сломает это для меня. Также, сколько групп захвата есть в регулярном выражении.
Это не сложно. Вы, очевидно, не видели [это] (http://www.ex-parrot.com/pdw/Mail-RFC822-Address.html). –
@rr - Только что начал обматывать мою голову вокруг регулярного выражения.Вероятно, дойдет до этого через пару лет :) – liv2hak
@ liv2hak: :) Продолжайте экспериментировать, помните, что каждый, кто отвечает здесь, также изучает его все больше и больше каждый день. –