Grep - регулярное выражение - матч до определенного слова

Допустим, у меня есть файл с линиями, как этотGrep - регулярное выражение - матч до определенного слова

abcefghijklxyz 
abcefghijkl

Я хочу, чтобы получить только строки между abc и концом строки. Конец строки может быть определен как обычный конец строки или строка xyz.

Мой вопрос

Как я могу получить только найденную строку, используя grep и регулярные выражения? Например, ожидаемый выход для двух линий, показанных выше, будет

efghijkl 
efghijkl

Я не хочу, начальный и конечный маркеры.

То, что я пытался до сих пор

grep -oh "abc.*xyz"

Я использую Ubuntu 13.04 и Bash оболочки.

источник

2013-12-04 thefourtheye

Downvoter, пожалуйста, дайте мне знать, что не так с этим вопросом. – thefourtheye

эта линия отсекает ведущий abc и заканчиваяxyz (если был), и дает вам необходимую информацию:

grep -oP '^abc\K.*?(?=xyz$|$)'

с вашим примером:

kent$ echo "abcefghijklxyz 
abcefghijkl"|grep -oP '^abc\K.*?(?=xyz$|$)' 
efghijkl 
efghijkl

еще один пример с xyz в середине текста:

kent$ echo "abcefghijklxyz 
abcefghijkl 
abcfffffxyzbbbxyz 
abcffffxyzbbb"|grep -oP '^abc\K.*?(?=xyz$|$)' 
efghijkl 
efghijkl 
fffffxyzbbb 
ffffxyzbbb

источник

2013-12-04 10:53:52 Kent

+1 Я не знаю, кто это проигнорировал. Я проверяю, работает ли это для моих фактических данных. – thefourtheye

downvote приветствуется, только если с объяснением, чтобы люди могли узнать, почему решение недостаточно хорошо (или плохо). Downvoter, вы бы опубликовали короткий комментарий? – Kent

Для чего нужен '\ K'? – Alfe

Используйте look-behind так:

$ grep -Po '(?<=abc)[^x]*' file 
efghijkl 
efghijkl

Он не получает все после abc и, пока он находит x.

на основе Kent's answer (не копировать, но для полноты), вы можете grep все в пределах abc и xyz (или конец строки):

$ grep -Po '(?<=abc).*(?=xyz|$)' file 
efghijklxyz 
efghijkl

источник

2013-12-04 10:52:43 fedorqui

Я тоже не хочу 'xyz'. Может ли это также быть разделено с регулярным выражением? – thefourtheye

Можете ли вы проверить обновленный код, @thefourtheye? – fedorqui

Да, @Alfe, как я говорю в своем ответе. – fedorqui

Использование СЭД:

sed -n '/abc/{s/.*abc\(.*\)/\1/;s/xyz.*//;p}' input

Производит:

efghijkl 
efghijkl

источник

2013-12-04 11:03:19 perreal

Или вы можете просто удалить то, что вам не нравится:

awk '/^abc/{sub(/^abc/,x);sub(/xyz.*$/,x)}1' file 
efghijkl 
efghijkl

xyz.*$ представляют все от xyz до конца строки.

источник

2013-12-04 11:38:44 Jotne

Grep - регулярное выражение - матч до определенного слова

ответ

Смежные вопросы