Я пытаюсь очистить это очень Шумный (из-за ОРЗ) набора данных имен и адресов электронной почты и одна проблема заключается несколько имен в одной записи, напримерСплит Строки в Java
"Fenner, Robert: Fishbume, Howard" should be "Fenner, Robert" and "Fishbume, Howard"
or "Fendrich, Karen N., Ricci, Vincent" should be "Fendrich, Karen N." and "Ricci, Vincent"
Как я мог использовать регулярное выражение для поиска записей, где строки разделены запятой или двоеточием, которые сами разделяются запятой, а затем разделяют строку?
другие варианты этой проблемы:
"'Emily Phaup ' Ryan, Thomas M" -> "Emily Phaup", "Ryan, Thomas M"
"A Lilly, Alisia Rudd, Andrew McComb, Daniel Lisbon, David Compton"
->"A Lilly", "Alisia Rudd", "Andrew McComb", "Daniel Lisbon", "David Compton"
"Abigail.Perlmangus.pm.com [email protected]" -> "Abigail.Perlmangus.pm.com", "[email protected]"
и несколько больше.
Я знаю, что это не может быть возможно отделить все эти вхождения (особенно без случайного sepperating правильных имен), но разделяя некоторые из них, безусловно, помогут
EDIT: Я думаю, мой вопрос немного слишком широк, поэтому я немного сужу его:
Есть ли способ найти строки с форматом "string1,string2, string3,string4"
(строки могут содержать любые символы и пробелы) и разделить их на две отдельные строки: "string1,string2" and "string3,string4"
?
и может кто-нибудь дать мне несколько указателей на то, как это сделать, потому что я довольно неопытен с регулярным выражением.
Неясно, что вы просите. Просьба представить четкие примеры возможных сценариев и попытаться опубликовать ваши попытки. – Maroun
Вы должны не только публиковать свой ввод, но и ожидаемый результат! Так что ты хочешь. – isnot2bad