Я хочу сравнить строковые представления 3 или 4-значных целых чисел. Я хочу сгруппировать их в пары «близости». То есть, pc_dud[3]
должен сочетаться с dud[0]
.python вычислить близость строк
dud = ['3433', '3467', '3551', '345', '345', '3613']
pc_dud = ['3401', '3402', '3430', '0342', '3584']
Кто-нибудь знает о хорошем инструменте для этого (я думал, что-то вроде медузы)? Другим решением, конечно же, было бы использование арифметической разницы в качестве индикатора «близости». Есть предположения?
[difflib] (http://docs.python.org/2/library/difflib.html). –
разница была бы проще, так как они просто цифры. если бы они были буквенно-цифровыми строками, то вы сделали бы эквивалентное расстояние levenshtein. –
Это зависит от того, как именно вы хотите свести к минимуму различия, например, если это нормально, чтобы принести в жертву пару, чтобы все остальные были гораздо ближе ... Если нет, я бы отсортировал списки и заархивировал их. – Jblasco