Мы взяли большое количество документов, разбитых на сегменты («единицы ответа»), используя сервис Watson's Document Conversion и добавили их в сборку Retrieve и Rank Solr. Если я запускаю запрос против коллекции, используя копию/вставку текста (может быть 150 слов) из одного из блоков ответа, Retrieve и Rank возвращают кучу документов, и (как ожидалось) результаты включают блок ответа, из которого текст запроса был скопирован. Однако эта единица ответа не является самым лучшим результатом; это обычно 7 или 8 документов сверху. Если я окружаю текст запроса кавычками, то Solr по праву считает эту фразу и возвращает только одну единицу ответа. Без кавычек, однако, должен ли документ с точной формулировкой в запросе по-прежнему оставаться верхним документом в результатах?Почему нет документа с точным совпадением первого результата в запросе Retrieve и Rank Solr?
ответ
Кажется, вы используете/выбираете конечную точку для поиска. Он не должен быть лучшим результатом, так как он не использует запрос фразы для поиска./select использует логический запрос, который принимает во внимание такие вещи, как idf score, чтобы получить итоговый результат solr. Вы заметили, добавив кавычки, вы можете принудительно вызвать запрос фразы, если ваше приложение захочет это сделать. Теперь это несет ответственность за знание того, какой тип запроса будет использоваться для вашего приложения.
Теперь, если вы используете/fcselect и обучаете систему, с течением времени ранг будет «учиться», что фразы в вашей паре вопросов/документов наиболее важны, если это действительно так. Затем он начнет перераспределять эти документы выше. Это, по сути, точка RnR заключается в том, чтобы узнать из запросов и документов о том, как перенести наиболее релевантные документы на верх, без приложения, требующего написать разные (часто сложные) solr-запросы для поиска документов.
- 1. Почему у меня нет двоеточия в запросе Retrieve и Rank Solr?
- 2. Почему Retrieve и Rank игнорируют мои индексы при запросе коллекции?
- 3. Результаты с точным совпадением
- 4. Как загрузить все документы из Retrieve и Rank (Solr)?
- 5. Ibm Bluemix Retrieve and Rank
- 6. Watson Retrieve & Rank Service и IBM Bluemix
- 7. Solr-Retrieve имя документа, в котором находится слово
- 8. Watson's Retrieve & Rank API с использованием Java
- 9. Rank & Retrieve, Не удалось подключиться к gateway.watsonplatform.net
- 10. SQL IN Operator с точным совпадением?
- 11. JTable-фильтрация с точным совпадением со строкой
- 12. Обновление схемы для конфигурации IBM Watson Retrieve и Rank
- 13. Пояснение по поводу "Ранг" для службы Retrieve & Rank в Java
- 14. watson retrieve-and-rank - manual ranking
- 15. Установка заголовка и идентификатора с помощью веб-интерфейса Retrieve and Rank
- 16. Почему нет документа, возвращаемого при запросе sub-doc в Mongoose?
- 17. FFMpeg avcodec_decode_video2 нет результата для первого кадра
- 18. Поиск MYSQL PHP с точным совпадением в поле
- 19. IBM Watson - Retrieve and Rank: Как сказать, что текст в документе PDF следует рассматривать как поле?
- 20. В запросе нет адресата для данных результата
- 21. Как я могу настроить ранжирование Retrieve и Rank со словарем/моделью доменных определений?
- 22. Почему solr возвращает результат только с точным поиском?
- 23. Как использовать MySQL как с порядком с точным совпадением
- 24. Задание вероятностного результата результата в solr
- 25. Сшивание изображений с точным совпадением (пиксель-пиксель) перекрытий
- 26. Функция Google removeDuplicates работает только с точным совпадением
- 27. Удаление документа в apache lucene с точным соответствием
- 28. Как запросить solr с совпадением + (обязательно), используя solrnet
- 29. solr - MoreLikeThisdocument в одном запросе
- 30. Выбор первого варианта с точным текстом capybara
Я не уверен, что RaR поддерживает его, но для обычного Solr, добавляющего 'debugQuery = true' к вашему запросу, вы получите информацию о том, какие термины вносят свой вклад в оценку и почему они оцениваются так, как они. Как рассчитывается оценка, зависит от того, какой класс сходства активен, а RaR может использовать собственный класс (или оценивать документы по другому полю). – MatsLindh