2010-01-27 3 views
5

Есть ли какой-либо инструмент или утилита или скрипт perl/python, который может находить самые длинные повторяющиеся подстроки в большом текстовом файле и печатать эти шаблоны и количество раз, когда происходит каждый шаблон?Утилита для поиска наиболее длинных повторяющихся строк

+0

Соответствующая информация: http://en.wikipedia.org/wiki/Longest_repeated_substring_problem – kennytm

ответ

2

http://en.wikipedia.org/wiki/Longest_repeated_substring_problem:

Самый длинный повторяется проблема подстроки находит самую длинную подстроку строки, которая происходит, по крайней мере в два раза. Эта проблема может быть решена в линейное время и пространстве, построив дерево суффикса для строки, и найти самый глубокий внутренний узел в дереве

Смежные вопросы