2012-03-06 2 views
0

Как прочитать последовательность ДНК из текстового файла на языке C и сохранить его в массиве и извлечь все подстроки заданной длины, начиная с каждой позиции нуклеотида?Как прочитать последовательность ДНК из текста Файл и сохранить его в массиве в C?

Для примера последовательность является следующим образом в текстовом файле

cctgatagacgctatctggctatccaggtacttaggtcctctgtgcgaatctatgcgtttccaaccat

Все подстроки всех исходных позиций

, если длина вспомогательной строки = 3

cct, ctg, tga, gat, ..., cat

+1

parse fasta/fastq файлы с этим: http://lh3lh3.users.sourceforge.net/parsefastq.shtml это очень удобно. – flies

ответ

0

Является ли язык C обязательным для вас?

Я хотел бы перейти на более высокий уровень языка, таких как Python, эта функция будет делать:

from itertools import count 

def iterate_fragments(sequence,size): 
    """Takes a string and yields pieces of given size.""" 
    for number in count(): 
     try: yield sequence[number:number+size] 
     except IndexError: break 

for fragment in iterate_fragments(dna_sequence,3): 
    print fragment 

Этот простой код будет печатать каждый фрагмент ДНК (3 нуклеотида размер).

Смежные вопросы