Python Регулярное выражение Соответствие: ## ##

Я ищу файл строки за строкой для появления ## random_string ##. Он работает при многократном # кроме ...Python Регулярное выражение Соответствие: ## ##

pattern='##(.*?)##' 
prog=re.compile(pattern) 

string='lala ###hey## there' 
result=prog.search(string) 

print re.sub(result.group(1), 'FOUND', string)

Желаемая Выход:

"lala #FOUND there"

Вместо этого я получаю следующее, потому что его захватывая все ### эй ##:

"lala FOUND there"

Так как бы я проигнорировал любое число # в начале или конце и только захватил «## string ##».

источник

2010-10-23 nubme

будьте осторожны с использованием ленивых кванторов, таких как '(. *?)', Потому что он будет соответствовать '## abC#####' и захватить 'abC###'.также ленивые кванторы очень медленны. – glebm

Чтобы соответствовать по крайней мере двух хешей на обоих концах:

pattern='##+(.*?)##+'

источник

2010-10-23 01:17:59

им извините, но я изложить мой вопрос плохой. Я хочу соответствовать ТОЧНО ## ## и игнорировать другой ### в начале или в конце (im вызывает re.sub, и он будет конфликтовать с моими результатами). – nubme

@nubme: Я не уверен, что вы имеете в виду. Это именно то, что мой ответ. Я просто протестировал его и подтвердил, что он выводит 'hey' и будет соответствовать только если строка имеет по крайней мере два символа' # 'на каждом конце. –

@marcelo: извините, я отредактировал мой вопрос, посмотрим, имеет ли он теперь больше смысла. – nubme

'^#{2,}([^#]*)#{2,}' - любое число #> = 2 на обоих концах

быть осторожным с использованием ленивых кванторов, как потому, что бы соответствовать '## а #####' и захват (*.?) 'а ###'. также ленивые кванторы очень медленно

источник

2010-10-23 01:17:25 glebm

Я думаю, что он хочет хотя бы 2 в начале * и * в конце. –

редактирование, спасибо – glebm

попробовать «блок комментарий трюк»: /##((?:[^#]|#[^#])+?)##/ Screenshot of working example

источник

2010-10-23 01:19:33

Добавление + в регулярное выражение, которое означает соответствуют одному или нескольким символам.

pattern='#+(.*?)#+' 
prog=re.compile(pattern) 

string='###HEY##' 
result=prog.search(string) 
print result.group(1)

Выход:

HEY

источник

2010-10-23 01:21:35

вы рассмотрели делать это без регулярных выражений путь?

>>> string='lala ####hey## there' 
>>> string.split("####")[1].split("#")[0] 
'hey'

источник

2010-10-23 01:45:00 ghostdog74

Ваша проблема с вашим внутренним соответствием. Вы используете ., который соответствует любому символу, который не является концом строки, а это значит, что он соответствует #. Поэтому, когда он получает ###hey##, он соответствует (.*?) - #hey.

Простое решение исключить # символ из Matchable набора:

prog = re.compile(r'##([^#]*)##')

Protip: Используйте сырые строки (например r'') для регулярных выражений, так что вы не должны сходить с ума обратный слеш.

Попытка разрешить # внутри хэшей сделает вещи много более сложным.

EDIT: Если вы не хотите, чтобы пустой внутренний текст (т.е. «####» не должен совпадать с внутренним текстом «»), а затем изменить его на:

prog = re.compile(r'##([^#]+)##')

+ означает «один или несколько».

источник

2010-10-23 02:56:40

>>> import re 
>>> text= 'lala ###hey## there' 
>>> matcher= re.compile(r"##[^#]+##") 
>>> print matcher.sub("FOUND", text) 
lala #FOUND there 
>>>

источник

2010-10-24 13:13:17 tzot

Python Регулярное выражение Соответствие: ## ##

ответ

Смежные вопросы