Рассмотрим следующие строки:RegEx производить повторяющиеся строки
mastectomy N
master NtVA
Слова слева отделяются от одного или нескольких флагов справа (которые указывают на возможные части-из-речи (POS) для слова в вопросе, то есть: может ли это быть существительным, глаголом и т. д.). Два столбца разделены на вкладку.
Я пытаюсь достичь следующего списка через RegEx Поиск & Заменить в моем текстовом редакторе:
mastectomy N
master N
master t
master V
master A
Цель состоит в том, чтобы сделать жизнь моей жизни легче работать со списком в Excel (для vlookups.) фактические данные 230K линии длинные и чувствительны к регистру (извлеченный из списка Moby)
пока что у меня есть это:.
[Найти] ([a-z]+)\t([a-z]?)([a-z]?)([a-z]?)([a-z]?)
[Заменить] \1\t\2\n\1\t\3\n\1\t\4\n\1\t\5
Но это не очень элегантно и гибко и создает бесполезные линии для слов, которые имеют только 1 флаг.
Как его улучшить?
Спасибо вы-
Фабьен
Сколько флагов у вас есть? Практически группировать флаги вместо слов? – Passerby
regex, вероятно, не самый подходящий инструмент. – Benoit
какой текстовый редактор вы используете? – JonM