У меня есть файл, который содержит две последовательности. У меня есть программа, которая может читать все последовательности, объединять их и отображать длину обеих последовательностей. Теперь я хочу отображать длину по отдельности. Две последовательности разделяются символом >
.Отображение длины отдельных последовательностей в файле
Пример:
SEQ1 >ATGGGACTAGCAGT
SEQ2 >AGGATGATGAGTGA
Программа:
#!usr/bin/python
import re
fh=open('clostp1.fa','r')
count=0
content=fh.readlines()
fh.close()
seq=''
patt=re.compile('>(.*?)')
for item in content:
m=patt.match(item)
if not m:
s=item.replace('\n','')
seq=seq+s
seq=seq.replace('\s','')
print seq
print 'The length of the coding sequence of the bacillus'
print len(seq)
Нежелательные образцы ('(. *?)' В вашем коде) не имеют смысла в конце шаблонов, поскольку они всегда будут соответствовать пустой строке. –