Я не специалист по биоинформатике. Я хочу выровнять две нуклеотидные последовательности, используя глобальный метод выравнивания. Каждая последовательность представляет собой комбинацию букв {A, C, T, G}.Как оценить схему подсчета баллов в парном выравнивании
Проблема в том, что я не знаю, как выбрать наилучшую схему подсчета очков (подстанции и штрафные санкции).
В настоящее время я использую значения + 1, -1, -2 для соответствия, несоответствия и штрафа за пробел. И я это знаю; число переходов в ДНК человека больше, чем количество трансверсий.
Мой вопрос заключается в том, как оценить штрафы за (совпадение, несоответствие и разрыв) на основе моего набора данных. Может ли какая-нибудь статистическая модель помочь?
Спасибо за ответ. но что вы имеете в виду «расходящиеся последовательности» и как мы можем это вычислить? – Omar14
Я обновил ответ, пожалуйста, проверьте –
Спасибо, я имел в виду, как мы вычисляем расходящиеся последовательности? статистически? – Omar14