2014-10-09 3 views
0

У меня есть много текста simmilar к этомуИзвлечение электронной почты из текста USIN Notepad ++ и регулярное выражение

Джамал Выбрать...АссистентБухгалтерВедущий специалистВладелецДокторДиректорЗаведующийЗам.директораГл.редакторГл.продавецГл.бухгалтерГен.директорГл.специалстИнженерКадровикПомощникПродавецПоварМенеджерНачальник отделаУправляющийУчредитель 923 230 24 54 922 009 72 00 [email protected] 

Я только нужно письмо от этой линии, так [email protected] Как мне это сделать с блокнотом и регулярным выражением?

Я нашел \b[A-Z0-9._%+-][email protected][A-Z0-9.-]+\.[A-Z]{2,4}\b Но его не все тоже тим Ва ищет

+0

Используйте регистронезависимым флажок. Он должен работать. – nhahtdh

+0

'[AZ] {2,4}' очень плохо подходит для соответствия TLD, см. Официальный список: https://data.iana.org/TLD/tlds-alpha-by-domain.txt – Toto

ответ

4

Вам нужно добавить в диапазоне строчные внутри класса символов или включите случае нечувствительной i модификатора, чтобы соответствовать верхней и строчных алфавитов.

\b[A-Za-z0-9._%+-][email protected][A-Za-z0-9.-]+\.[A-Za-z]{2,4}\b 

ИЛИ

(?i)\b[A-Z0-9._%+-][email protected][A-Z0-9.-]+\.[A-Z]{2,4}\b 

DEMO

+0

Это работает наполовину, i также нужно извлечь его как-то, так что я вижу только электронные письма – AudioTroubler

+0

извлечение его ?? –

+1

Это регулярное выражение, находит все электронные письма, но как я могу отделить выбранные письма от всего мусора? – AudioTroubler