У меня есть файл ДНК в следующем формате:Как прочитать этот файл с помощью Python?
>gi|5524211|gb|AAD44166.1| cytochrome
ACCAGAGCGGCACAGCAGCGACATCAGCACTAGCACTAGCATCAGCATCAGCATCAGC
CTACATCATCACAGCAGCATCAGCATCGACATCAGCATCAGCATCAGCATCGACGACT
ACACCCCCCCCGGTGTGTGTGGGGGGTTAAAAATGATGAGTGATGAGTGAGTTGTGTG
CTACATCATCACAGCAGCATCAGCATCGACATCAGCATCAGCATCAGCATCGACGACT
TTCTATCATCATTCGGCGGGGGGATATATTATAGCGCGCGATTATTGCGCAGTCTACG
TCATCGACTACGATCAGCATCAGCATCAGCATCAGCATCGACTAGCATCAGCTACGAC
Как прочитать этот файл и извлечь часть последовательности ДНК (ACCAGAGCGG...
) без каких-либо новых строк, например:
ACCAGAGCGGCACAGCAGCGACATCAGCACTAGCACTAGCATCAGCATCAGCATCAGCCTACATCATCACAGCAGCATCA
Возможно регулярное выражение не нужен?
Вы задаете много вопросов о Python в этом проекте ДНК. –
@jed - но, по крайней мере, ответы отмечены как принятые (и, надеюсь, упреждаемые). – Kev
Я как-то вроде noob на python. – y2k