я пытаюсь найти способ, чтобы рассчитывать питон определенного подмножества строки, которая отличается от обычного str.count("X")
граф конкретных групп букв в питоне, не исключая их
Вот мой общий пример. Моя переменная dna="AAAAA"
Моя цель - распознать каждый набор «AA», который существует в строке. Когда я запускаю dna.count("AA")
Я получаю предсказуемый результат 2 при печати.
Однако результат, который я ищу, представляет собой результат 4. Вот изображение, чтобы визуально показать то, что я говорю. (Я бы добавил изображение, но у меня нет 10 репутации, поэтому я должен отправить ссылку) https://docs.google.com/drawings/d/16IGo3hIstcNEqVid8BI6uj09KX4MWWAzSuQcu8AjSu0/edit?usp=sharing
Мне не удалось найти удовлетворительное решение этой проблемы в другом месте. Наверное, потому что я не уверен, что назвать моей проблемой. EDIT: Мне сообщили, что это подсчет перекрывающихся подстрок.
Вопрос становится более сложным, так как полная программа не будет иметь ни одной повторяющейся буквы в строке, а четыре буквы (ATCG), повторяющиеся случайным образом для неопределенных длин. Вот пример: dna="AtcGTgaTgctagcg"
Мне нужен скрипт, чтобы выложить сколько пар AT, TC, CG, TG и т. Д. Существует. Двигая одну букву пошагово вправо.
спасибо.
Это может помочь: http://stackoverflow.com/questions/11430863/how-to-find-overlapping-matches-with-a-regexp – Azee