2016-05-19 5 views
0

Имеются следующие тексты, которые у меня есть.RegEx до определенной группы символов

"Ceo and founder at xyz labs" 
"bartender | manager" 
"Buyer & Seller at sailaway" 

Что я ищу является регулярное выражение, которое будет разметить вокруг следующих символов and, |, &. Конечный конечный результат должен быть чем-то вроде Ceo для первого, bartender для второго и Buyer для второго. Вышеприведенные примеры и использование разделения для каждого из них не обязательно будут работать, поскольку это большой текстовый файл.

+0

Вы хотите сохранить эти строки? и какой должен быть конечный результат? – rock321987

+0

@ rock321987 Я извиняюсь за то, что не вкладываю в то, что я ищу. Перейдите и проверьте мое редактирование. – TheM00s3

+0

Как это может быть «Цео и Основатель», если вы разбиваете разделы на «и»? – rock321987

ответ

2

Вы можете использовать

re.split(r"\band\b|\||&", y)[0] 

Python код

>>> x = ['Ceo and founder at xyz labs', 'bartender | manager', 'Buyer & Seller at sailaway'] 
>>> import re 
>>> [re.split(r"\band\b|\||&", y)[0].strip() for y in x] 
['Ceo', 'bartender', 'Buyer'] 
0

Вам не нужно регулярных выражений, вам нужно string.split:

"Ceo and founder at xyz labs".split("and")[0].strip() == "Ceo" 
"bartender | manager".split("|")[0].strip() == "bartender" 
"Buyer & Seller at sailaway".split("&")[0].strip() == "Buyer" 
1
import re 

p = re.compile(r'\band\b|&|\|') 
p.split(string)[0] 

\b обеспечивает ваши и является автономным словом

Смежные вопросы