У меня есть определенные строки, у которых есть идентификаторы в 4-м столбце файла, заканчивающиеся на «: E1» (я хочу удалить эти строки, которые имеют 4-й столбец, конкретно заканчивающийся: E1 not : E11 или: E10 s и т. Д.). Когда я делаю Grep Я понимаю, что есть 87 линии, имеющей этого шаблонУдаление буквенного числового суффикса в файле
grep "\:E1\b" File | wc -l
87
Однако, когда я
sed '/:E1$/d' File > tmp
wc -l File
245797 File
wc -l tmp
245797 tmp
который совпадает с первоначальной длиной файла, в котором указывается, что линии с рисунком окончания с: E1 не удаляется. Где я ошибаюсь в понимании команды? файл выглядит следующим образом
chr1 133374 133566 ENSG00000238009:E1 - ENSG00000238009 1
chr1 995083 995226 ENSG00000217801:E1 + ENSG00000217801 1
chr1 1385294 1385499 ENSG00000215915:E1 + ENSG00000215915 1
chr1 10003388 10003465 ENSG00000162441:E1 - ENSG00000162441 1
chr1 38273332 38273352 ENSG00000197982:E1 + ENSG00000197982 1
Я хочу, чтобы удалить строки, оканчивающиеся на: E1 в 4-м столбце
В вашем регулярном выражении ': E1 $' '$' означает конец строки. Ни одна из строк не заканчивается символом ': E1'. –
Я отредактировал его «чтобы линии с рисунком, заканчивающиеся на: E1 не удаляются» – AishwaryaKulkarni
Вы говорите: «хотите удалить те, которые заканчиваются на: E1» и «Я хочу удалить строки, заканчивающиеся на: E1 в 4 й столбец "и" что линии с шаблоном, заканчивающиеся на: E1, не удаляются ". Что он? Пожалуйста, уточните этот вопрос. –