Чтобы ответить на вопрос, заданный в вашей статье, вы можете получить счетчик количества совпадающих символов в двух строках с:
In [1]: s1 = 'Can We Live (feat. Cece Rogers) [Joke Instrumental Mix]'
In [2]: s2 = 'Can We Live (feat. Cece Rogers) Joke Instrumental Mix'
In [3]: if len(s1) > len(s2): # swap strings so that s1 is shortest
.....: s1, s2 = s2, s1
.....:
In [4]: sum(c1==s2[i] for i, c1 in enumerate(s1))
Out[4]: 32
Но это не может быть достаточно хорошей мерой подобия для ваших целей , Посмотрите на Levenshtein distance и его реализацию в distance
module, если это так.
EDIT: @Veedrac совершенно правильно: более простой, однострочный решение без обмена является:
sum(c1 == c2 for c1, c2 in zip(s1, s2))
(zip
игнорирует элементы в более длинной последовательности).
Что вы пробовали? – fledgling
вы можете найти Edit Distance между вашими строками – njzk2
http://stackoverflow.com/questions/24572299/using-python-efficiently-to-calculate-hamming-distances? –