2015-01-12 3 views
0

Например:Как я могу совместить совпадения символов в строке в python?

String 1: Can We Live (feat. Cece Rogers) [Joke Instrumental Mix] 
String 2: Can We Live (feat. Cece Rogers) Joke Instrumental Mix 

Match count = 53 

Прочитал это: Character match count between strings in perl

Хочет сделать это pythonically.

+1

Что вы пробовали? – fledgling

+0

вы можете найти Edit Distance между вашими строками – njzk2

+0

http://stackoverflow.com/questions/24572299/using-python-efficiently-to-calculate-hamming-distances? –

ответ

1

Чтобы ответить на вопрос, заданный в вашей статье, вы можете получить счетчик количества совпадающих символов в двух строках с:

In [1]: s1 = 'Can We Live (feat. Cece Rogers) [Joke Instrumental Mix]' 
In [2]: s2 = 'Can We Live (feat. Cece Rogers) Joke Instrumental Mix' 

In [3]: if len(s1) > len(s2):  # swap strings so that s1 is shortest 
    .....:  s1, s2 = s2, s1 
    .....:  

In [4]: sum(c1==s2[i] for i, c1 in enumerate(s1)) 
Out[4]: 32 

Но это не может быть достаточно хорошей мерой подобия для ваших целей , Посмотрите на Levenshtein distance и его реализацию в distance module, если это так.

EDIT: @Veedrac совершенно правильно: более простой, однострочный решение без обмена является:

sum(c1 == c2 for c1, c2 in zip(s1, s2)) 

(zip игнорирует элементы в более длинной последовательности).

+0

Или просто 'sum (c1 == c2 для c1, c2 в zip (s1, s2))' без подкачки. Heck, даже просто 'sum (map (eq, s1, s2))' с 'из оператора import eq'. – Veedrac

Смежные вопросы