2016-12-05 3 views
0

У меня есть эти последовательности:счета мотивы в последовательности днк

GCAGGCATAGTCGGAACTGCTCTAAGCCTATTAATTCGAGCTGAGCTAAGCCAGCCTGGGGCTCTGCTCGGAGATGA 
AGTGGGCTTGTTGGGACTGGTCTTTCTTTATTAATTCGTTTTGAGTTAGGCACTGTTGGAGTTTTATTAG---ATAA 
GCAGGAATAGTTGGAACCGCCCTTAGCTTATTAATTCGAGCAGAACTCAGCCAACCTGGTGCCTTATTAGGGGATGA 
GCTGGCATAGTAGGAACTGCCCTTAGCCTTTTAATTCGAGCAGAGCTCAGTCAACCCGGAGCCCTGCTCGGAGATGA 
GCAGGAATAGTTGGAACTGCACTAAGCCTTTTAATTCGAGCTGAACTAAGCCAACCCGGAGCATTACTTGGAGACGA 

Они были бы на самом деле больше, но право не это не важно.

Я хотел бы оценить заданное значение для последовательностей с учетом количества мотива/с.

Я хотел бы рассчитывать на (количество) мотив/с, как "ATCGCGCGCGCTTTAAA" в данной последовательности, а затем используйте это число для оценки значения для этой последовательности.

Я знаю, что вы можете использовать логический вопрос, чтобы спросить, имеет ли данная последовательность мотив, но я бы хотел их сосчитать.

Благодаря

ответ

0

EMBOSS Fuzznuc: http://emboss.sourceforge.net/apps/release/6.6/emboss/apps/fuzznuc.html

fuzznuc поиски для определенного шаблона PROSITE стиля в нуклеотидных последовательностях. Такие шаблоны являются спецификациями (обычно короткой) длины последовательности, которая должна быть найдена. Они могут определять поиск точной последовательности или допускать различные неоднозначности, сопоставлять переменные длины последовательности и повторяющиеся подразделы последовательности. Одна или несколько нуклеотидных последовательностей считываются из файла. Вывод - стандартный файл отчета EMBOSS, который включает данные, такие как местоположение и оценка любых совпадений.

биоинформатики вопросы, вы должны спросить biostars.org

Смежные вопросы