Я использую Neo4j как базу данных. Я должен ежедневно хранить тысячи статей, и мне нужно предоставить функцию поиска, где я должен вернуть статьи, содержимое которых соответствует ключевым словам, введенным пользователями. Я проиндексировал содержимое каждой статьи и запросил по индексу, как показано нижеNeo4j - запрос с Lucene
val articles = article_content_index.query("article_content", search string)
Это прекрасно работает. Но, это занимает много времени, когда строка поиска содержит общие слова типа «the», «a» и т. Д., Которые будут присутствовать в каждой статье.
Как решить эту проблему?
утра уже с использованием полнотекстового индекса ("article_content", некоторые (Карта ("поставщика "->" lucene "," type "->" fulltext "))) – yAsH
рассмотрите спецификацию специального анализатора, который предотвращает присутствие таких слов, как 'the', 'a'. Документация Lucene должна давать некоторые подсказки. –
В этом случае я не получаю никаких результатов, если строка поиска является просто «или» или «а»! – yAsH