Я ищу поисковую систему документа (например, Xapian, Whoosh, Lucene, Solr, Sphinx или другие), которая способна искать частичные термины.Поиск документов по частичным словам
Например, при поиске термина «Brit» поисковик должен возвращать документы, содержащие либо «Britney» или «Британию» или вообще любой документ, содержащий соответствующий слово г *brit*
тангенциально, я заметил, большинство двигателей использовать TF-IDF (временная частота - обратная частота документа) или ее производные, которые основаны на полных условиях, а не на частичных условиях. Существуют ли какие-либо другие методы, которые были успешно реализованы помимо TF-IDF для поиска документов?
Я рекомендую вам добавить тег поисковой системы на ваш вопрос, lucene, Xapian или, по крайней мере, поисковую систему. Поиск - это общий тег, люди, которые находятся в поисковых системах, могут устать читать всевозможные странные запросы для вопросов, не связанных с поисковой системой. Удачи! – shellter
Спасибо за предложение убежища. Добавлено больше тегов. – GeneralBecos
По какой-либо причине вы не прочитали документацию по различным двигателям. Lucene (и, следовательно, Solr) поддерживает поиск по шаблону: http://wiki.apache.org/lucene-java/LuceneFAQ#What_wildcard_search_support_is_available_from_Lucene – ewh