1

У меня есть ~ 13K последовательностей на 120 оснований, и я хочу сравнить их, чтобы найти такие вещи, как консервативные регионы, среднее отклонение между ними или очень расходящиеся выбросы.Вычислить (среднюю) расходимость последовательности для многих последовательностей

Проблема в том, что с этим количеством последовательностей вещи, которые я пробовал, не выполнимы.

Так кто-нибудь сделал что-то подобное в этом размере и может дать мне несколько советов, как его достичь? Или, может быть, просто советы, на которых я должен искать?

ответ

2

Используйте программу dnadist пакета PHYLIP. У вас есть помощь в библиотеке Biopython для обработки формата выравнивания Phylip here.