Учитывая несколько текстов, которые немного отличаются друг от друга (некоторые слова отсутствуют/заменены другими словами), есть ли хороший алгоритм для создания своего рода «шаблона»? Например:Алгоритм сравнения нескольких текстов
Input:
- Hello my name is Bob
- Hi my name is Bob
- Hi my name is John
Output:
- * my name is *
Алгоритм должен быть максимально толерантными, как можно отклоняющихся значений, например, если добавить четвертый вход:
- Hello i am Bob
Это не должно влиять на результат слишком много.
Поиск часто встречающихся подстрок? –