Есть ли какой-либо инструмент или утилита или скрипт perl/python, который может находить самые длинные повторяющиеся подстроки в большом текстовом файле и печатать эти шаблоны и количество раз, когда происходит каждый шаблон?Утилита для поиска наиболее длинных повторяющихся строк
5
A
ответ
2
http://en.wikipedia.org/wiki/Longest_repeated_substring_problem:
Самый длинный повторяется проблема подстроки находит самую длинную подстроку строки, которая происходит, по крайней мере в два раза. Эта проблема может быть решена в линейное время и пространстве, построив дерево суффикса для строки, и найти самый глубокий внутренний узел в дереве
дерев суффиксов в питоне (немного устаревший, хотя ..) : http://hkn.eecs.berkeley.edu/~dyoo/python/suffix_trees/
реализация Javascript с дальнейшим: объяснению http://www.allisons.org/ll/AlgDS/Tree/Suffix/
Смежные вопросы
- 1. Эффективный алгоритм поиска для поиска повторяющихся строк
- 2. Каков наиболее эффективный тип данных MySQL для длинных битовых строк?
- 3. Вывод наиболее длинных путей
- 4. Простой инструмент для поиска наиболее повторяющихся терминов в тексте
- 5. Каков наиболее эффективный способ конкатенации и хранения длинных битовых строк?
- 6. SQL SERVER CHARINDEX() не возвращает индекс для длинных строк поиска
- 7. структуры данных для управления длинных строк бит
- 8. Число наиболее длинных общих подпоследовательностей
- 9. Найти количество уникальных наиболее длинных общих подпоследовательностей
- 10. Утилита для расширения строк String
- 11. запрос для определения длинных строк
- 12. Производительность Кассандры для длинных строк
- 13. Простейшее решение для повторяющихся строк
- 14. VBA для повторяющихся строк
- 15. Функция для повторяющихся строк
- 16. наиболее эффективный способ поиска позиций повторяющихся значений php
- 17. Функция Excel для поиска повторяющихся строк в большой таблице
- 18. Regex/Algorithm для поиска 'n' повторяющихся строк в файле
- 19. Печать длинных шестнадцатеричных строк
- 20. Выполнение SQL-запросов для длинных строк
- 21. наиболее эффективным SQL для поиска
- 22. Как рассчитать число наиболее длинных общих подпоследовательностей
- 23. Утилита Windows для поиска номеров и операций?
- 24. Разбивка длинных строк
- 25. Форматирование длинных строк python
- 26. Эффективный SQL-запрос для удаления повторяющихся строк
- 27. Эффективный алгоритм поиска повторяющихся битовых шаблонов?
- 28. объединение строк для повторяющихся значений
- 29. проверка cakephp для повторяющихся строк
- 30. Сжатие строк для повторяющихся символов
Соответствующая информация: http://en.wikipedia.org/wiki/Longest_repeated_substring_problem – kennytm