Я разрабатываю индекс поиска Lucene, который включает ранжированные теги для каждого документа.Solr/Lucene: оценка отдельных тегов
Пример:
Document 1
tag: java , rank 1.2
tag: learning, rank 2.1
tag: bugs, rank 1.2
tag: architecture: rank 0.3
Теги приходит из автоматизированного алгоритма классификации, которая также присвоения баллов.
Как создать индекс, чтобы я мог запросить поиск комбинации тегов и вернуть наиболее релевантные результаты? Например, поиск java + обучения
Я изначально создал поле для каждого тега и использовал ранг для увеличения поля для каждого документа. Это хороший подход с точки зрения производительности? Что делать, если у меня есть 10 000 возможных тегов? Хорошо ли иметь 10 000 ПОЛЕЙ в Луцене?
Если я вместо этого добавлю все теги в одно и то же поле, как я могу принять во внимание ранг?