Вот очень простой способ построить suffix array из строки в Python: def sort_offsets(a, b):
return cmp(content[a:], content[b:])
content = "foobar baz foo"
suffix_array.sort(cmp=sort_offsets)
Для двух строк A и B мы определяем сходство строк как длину самого длинного префикса, общего для обеих строк. Например, сходство строк «abc» и «abd» равно 2, а подобие строк «aaa» и «aaab» равно 3. Ра
Я реализую алгоритмы в http://portal.acm.org/citation.cfm?id=1813708, которые используют массивы суффикса для поиска наиболее длинных общих подстрок. Алгоритмы включают построение массива суффиксов дл
Я ищу написать эффективный метод цепи Маркова n-порядка для генерации случайных текстовых строк с учетом набора текста примера. В настоящее время у меня есть реализация Java, которая использует нескол