2014-10-30 2 views
0

Я использую именованный классификатор сущностей для обнаружения художников в тексте. В настоящее время я хочу обнаруживать шаблоны в тексте, который неоднократно появляется.повторяет определенные символы после String

11.20.12 Dillon Francis + Clockwork///Trees . 
11.24.12 Michael Woods///Lizard Lounge . 
12.08.12 Flosstradamus///Lizard Lounge . 
12.14.12 Mat Zo///Lizard Lounge . 
12.31.12 New Years Eve with BT///Lizard Lounge . 

В тексте можно обнаружить следующие именованные объекты:

11.20.12 Dillon Francis + Clockwork///Trees . 
[Dillon Francis] 
11.24.12 Michael Woods///Lizard Lounge . 
[Michael Woods, Lounge] 
12.08.12 Flosstradamus///Lizard Lounge . 
[Lizard Lounge] 
12.14.12 Mat Zo///Lizard Lounge . 
[Lizard Lounge] 
12.31.12 New Years Eve with BT///Lizard Lounge . 
[Lizard Lounge] 

Я хочу использовать Regex для обнаружения, если шаблон повторяется несколько раз. Поэтому, когда найден Диллон Фрэнсис, я вижу, что после названного существа используются специальные символы, кроме, и. поэтому

[named entity][special chars] [ words ] endline 

Как я могу перевести это регулярное выражение?

Что я пробовал:

([named entity])*([^\\dA-Za-z : , \\. ]) 
[^(Dillon Francis)]*[^a-zA-Z0-9] 

Выход является истинным или ложным.

+0

Я did'nt понимаю, что вы хотите на выходе ... – Sly

+0

Если предложение имеет [специальные символы] [слова] после [именованного объекта] , Это чем нужно вернуть true или false –

+1

что-то вроде этого? http://regex101.com/r/nT7wN8/1 – Sly

ответ

1

Что-то вроде этого:

^[0-9.]{8}\s(Dillon Francis|Michael Woods|Mat Zo)[ \/+]+([A-Za-z0-9 .]+)$ 

Demo here

Смежные вопросы