Я пишу программу Java, которая должна найти возможные совпадения для указанных строк. Строки, как правило, быть в формеСтратегия поиска
onetwothree one.two.three onesomethingtwoblah onesomething
, где две и три части фактического заголовка. Квантовые совпадения из базы данных имеют форму 1 + 2 + 3. Метод, который я придумал, - сравнить каждый токен от кандидатов базы данных со всей указанной строкой с использованием регулярного выражения. Счетчик количества совпадений маркеров базы данных будет использоваться для определения ранжирования возможных совпадений.
Меня беспокоит точность представленных совпадений и способность метода успешно находить совпадения, если они существуют. Является ли этот метод эффективным?