Использование регулярных выражений для извлечения данных из следующей строки

У меня есть строки, какИспользование регулярных выражений для извлечения данных из следующей строки

st = " * ** abc * def ghi **abc* mn*"

Я хотел бы, чтобы извлечь список, содержащий уникальные элементы между * с, что в этом случае будет:

['abc', 'def ghi', 'mn']

Мой подход:

se = set([x.strip() for x in re.split('\*+', st)]) 
se.discard('') 
l = list(se)

Я новичок в регулярных выражениях. Есть ли лучший способ сделать это?

источник

2016-06-04 Mehdi Jafarnia Jahromi

Почему вы конвертируете обратно в список после? –

лучше в каком смысле? лучше субъективный термин .. – rock321987

Вы хотите сохранить заказ? – schwobaseggl

Вы могли бы это сделать в одном операторе:

se = list(set([x.strip() for x in re.split('\*+', st)]) - {''})

Это не обязательно должен быть более предпочтительным, чем ваше решение для удобства чтения, однако.

источник

2016-06-04 18:21:57 holdenweb

Вот еще более короткий «список» (set (re.split ('[*] * \ * *', st)) - {''}) '. Но это явно не очень хорошее решение, потому что его так трудно читать. –

-3

Получил данные, предоставленные вами, и попробовал приведенный ниже код. Поскольку вы упомянули об использовании регулярного выражения, которое звучит разумно, у меня есть это предложение. Вы можете улучшить этот код и опубликовать свою окончательную версию.

import re 

st = " * ** abc * def ghi **abc* mn*" 

mystrs = re.compile('\w+') 
allstrs = re.findall(mystrs, st) 
print allstrs

Выход:

[ 'ABC', 'Защиту', 'ГХИ', 'ABC', 'тп']

источник

2016-06-04 18:24:14 Ramu

Это разделяет «def» и «ghi»! – schwobaseggl

Мой ответ пересек с одним из @holdenweb, его решение кажется более подходящим для ваших нужд. – Ramu

Это не дает правильного выхода. '['abc', 'def ghi', 'mn']' –

Нет необходимости запустить регулярное выражение двигатель:

testcase = " * ** abc * def ghi **abc* mn*" 
list(set(s.strip() for s in testcase.split("*")) - {''})

источник

2016-06-04 18:26:20 Jasper

Yeh, я сформулировал решение на основе полосы, прежде чем я наткнулся на трюк '- {" "}', чтобы удалить пустые контейнеры. – holdenweb

Возможно, вам понравится [Шаблоны Python - Анекдот оптимизации] (https://www.python.org/doc/essays/list2str/) – holdenweb

Как об этом:

>>> st = " * ** abc * def ghi **abc* mn*" 
>>> 
>>> list(set(x.strip() for x in st.split('*') if x.strip())) 
['mn', 'def ghi', 'abc']

Или если вы prefe r к использованию функций, то:

>>> st 
' * ** abc * def ghi **abc* mn*' 
>>> l = [] 
>>> def f(x): 
     x = x.strip() 
     if x: 
      return x 


>>> for elem in st.split('*'): 
     x = f(elem) 
     if x and x not in l: 
      l.append(x) 


>>> l 
['abc', 'def ghi', 'mn']

источник

2016-06-04 19:04:57

Использование регулярных выражений для извлечения данных из следующей строки

ответ

Смежные вопросы