У меня есть словарь с около миллиона слов. Я должен разработать алгоритм для быстрого поиска последовательности символов., который datastructure или алгоритм, используемый для упорядочивания данных словаря для поиска последовательности?
Для примера. если пользовательские типы and
приложение должно возвращать слова, имеющие такую же последовательность, как random
, sand
, stand
... и т. д.
Существующее решение, которое у меня есть, - это поиск соответствующего регулярного выражения во всех существующих словах, которые неэффективны. Я открыт для реструктуризации существующей базы данных, кеширования словаря или работы на любом уровне, если требуется. Или есть ли готовые api в java?
Это направлено на создание lucene, любое предложение дизайна db или классов. – Sankalp
Ну, дизайн БД - это то, что вы хотите индексировать, должно быть сплюснутой структурой. Для построения индекса, его вида, чтения набора результатов и добавления в индекс. Предположим, вы хотите добавить три столбца для индексируемой записи, вы можете сделать что-то вроде: –