В Solr 4. *, предположим, у меня есть поле "mytext"
.Solr: Как решить этот случай пользователя
Первая запись в "
mytext
" является "working at ABC
".Вторая запись в категории "
mytext
" есть "working at ABC project ABC
".
Теперь, когда я ищу "Working at ABC
", то последовательность документов
Doc 1: "Working at ABC project ABC
"
Doc 2: "Working at ABC
"
Хотя по расчетам это имеет смысл, второй документ должен быть сверху, потому что он содержит «ABC» дважды (TF выше для второго документа).
Но с точки зрения пользователя, когда запрос, введенный "работает на ABC" результат должен быть
"Working at ABC"
"Working at ABC project ABC"
.
Как справиться с такими сценариями. Этот проект возникает только тогда, когда «Компания» и «Проект» имеют перекрывающиеся данные. Как в этом случае его «ABC».
Благодаря
Amit Аггарваль
вы должны спросить себя, почему doc2 должны иметь более высокий ранг? это имеет больше смысла для пользователя, но почему? в противном случае вы будете продолжать циклы, а в другом случае у вас будет противоположный случай. – Emad
вы всегда можете переопределить класс подобия в файле схемы и предоставить свою собственную реализацию для расчета TF, IDF, норм и т. Д. Что я обычно делаю, когда есть странный случай. – Emad