REGEX шаблона для Exlude определенной строки

У меня есть строка, которые имеют следующий формат:REGEX шаблона для Exlude определенной строки

some text <br>septembar 1989<br>

И я использую это регулярное выражение найти месяц и год Часть

<br/?>(?!=b\.)(.*?\b\d{4}\b)

и я получаю то, что я want- septembar 1989

Однако, теперь у меня есть ситуации, когда   вставлена

<br>some text <br>septembar 1989<br>

результат: some text septembar 1989

Можете ли вы предложить, как изменить свой существующий шаблон для поддержки обоих случаях? Я думаю, мне нужно как-то Exlude   от согласования в .*?

источник

2013-03-04 Zed

Ваш шаблон не работает – eyquem

Попробуйте это

<br/?>([^<]+)\d{4}

[^<] средства соответствуют ничего, кроме открывающего тега, который является то, что вы хотите.

источник

2013-03-04 13:15:46 deadlock

import re 

ss = 'dfgqeg<br>some text <br>septembar 1989<br>' 

reg = re.compile('<br(?: /)?>' 
       '(?!.+?<br(?: /)?>.+?<br(?: /)?>)' 
       '(.+?\d{4})' 
       '<br(?: /)?>') 

print reg.search(ss).group(1)

'<br(?: /)?>' уловы   и   вхождений

'(?!.+?<br(?: /)?>.+?<br(?: /)?>)' является упреждающая утверждение,
он проверяет, что после того места, где она начинается в анализируемом тексте, есть не набор символов описывается как последовательность:
- .+? любого вида персонажей, но ? заказов, что эта часть должна остановить как только   или   встречается
-   или  
- снова любого рода символов, останавливающихся перед тем   или  
-   или

источник

2013-03-04 13:24:29 eyquem

Я написал простой код, может быть вы найдете полезными до некоторой степени:

import re 
def getDate(str): 
m = re.match("[\<br>]*[\w\s]*\<br>([\w\s]*[12][0-9]{3})",str); 
return m.group(1) 

print getDate("some text <br>dec 1989<br>"); 
print getDate("<br> some text <br>septembar 1989<br>"); 
print getDate("grijesh chuahan <br>feb 2009<br>");

Выход:

dec 1989 
septembar 1989 
feb 2009

источник

2013-03-04 13:52:52

REGEX шаблона для Exlude определенной строки

ответ

Смежные вопросы