У меня есть данные, что всегда приходит в блоке из четырех в следующем формате (так называемый FASTQ):Преобразование FASTQ в FASTA с SED/AWK
@SRR018006.2016 GA2:6:1:20:650 length=36
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGN
+SRR018006.2016 GA2:6:1:20:650 length=36
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!+!
@SRR018006.19405469 GA2:6:100:1793:611 length=36
ACCCGCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC
+SRR018006.19405469 GA2:6:100:1793:611 length=36
7);;).;);;/;*.2>/@@7;@77<..;)58)5/>/
Есть простой СЕПГ/AWK/Баш путь чтобы превратить их в этот формат (так называемый FASTA):
>SRR018006.2016 GA2:6:1:20:650 length=36
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGN
>SRR018006.19405469 GA2:6:100:1793:611 length=36
ACCCGCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC
в принципе, мы хотим, чтобы извлечь первые две строки в каждом из блоков из-4 и заменить @
с >
.
Хорошо, я только что получил головную боль. – Homework