Я хотел бы исключить одинаково названные параграфы (содержащие разные строки данных, ДНК в моем случае).Устранение одинаково названных абзацев
Например мой файл:
>blue
1. agccttgatcgttac
2. tttactaaagatgat
3. agccttga
>orange
1. tttactaaagatg
2. agccttgatcgtt
3. tttacta
>blue
1. caatgcatgcaga
2. agccttgatcgtt
3. tttactaaagatg
4. caatgca
Я хотел бы, чтобы удалить все одинаково названные пункты, оставив только один из них (в данном случае, если один из «>» синий). Каждый абзац начинается с «>». Как я могу это сделать?
Вы хотите удалить повторяющиеся строки в начале файла или строки, которые совпадают до пробела или запятой или любой другой точки пунктуации? –
Дэвид, извините, я хочу исключить (в данном случае) один заголовок (-blue) и связанные строки (anothertextex) до следующего символа «-» следующего заголовка. Строки отличаются друг от друга (все они). – user3660245
Позвольте мне сказать так: вы хотите исключить одинаково названные параграфы? Это может привести к чрезмерному использованию awk. Измените свой вопрос и добавьте: «Параграф разделен с ...» и укажите, какой символ или строка обозначают конец абзаца. –