2016-04-18 1 views
4

Мы пытаемся объединить фразы вместе, чтобы улучшить результаты.Как я могу настроить ранжирование Retrieve и Rank со словарем/моделью доменных определений?

Например, если пользователь задает вопрос типа «Когда мне нужно изменить фильтр моего кондиционера?» с определенной фразой домена, такой как «кондиционирование воздуха», R & R возвращает несколько ответов, содержащих термин «воздух», а не «кондиционирование» или возвращает ответы, содержащие другие термины, такие как воздушная подушка или воздушный фильтр.

Это может быть выполнено с использованием необработанного экземпляра Solr и установки фразы между кавычками. Таким образом, запрос Solr будет выглядеть следующим образом:

...  
"debug": { 
    "rawquerystring": "When do I have to change the filter of my \"air conditioning\" ?", 
    "querystring": "When do I have to change the filter of my \"air conditioning\" ?", 
    "parsedquery": "text:when text:do text:i text:have text:to text:change text:the text:filter text:of text:my PhraseQuery(text:\"air conditioning\") text:?", 
    "parsedquery_toString": "text:when text:do text:i text:have text:to text:change text:the text:filter text:of text:my text:\"air conditioning\" text:?",  
... 

Однако R&R guide состояния:

Синтаксис отличается от стандартного синтаксиса Solr следующим образом:

Вы можете искать один термин или фразу. Вам не нужно, чтобы окружал фразу двойными кавычками, как с Solr, но вы могут включать фразы в запросе, и они учитываются в моделях ранжирования .

Мы не смогли найти более подробную информацию о вышеуказанном заявлении.

Но, как мы понимаем, ранжир должен идентифицировать фразы. Если это так, нам было интересно, есть ли способ, которым мы можем установить словарь фраз для настройки ранжирования? Или, можно ли создать собственную модель правовых фраз? Каковы варианты достижения этой цели?

Благодаря

ответ

3

В настоящее время RnR не поддерживает строгие фразы обработки запросов, хотя есть особенности, которые будут иметь срок порядок и условия примыкающих во внимание. Мы работаем над новой версией сервиса, в которой пользователи смогут использовать полный регулярный синтаксис запроса запроса (включая указание фраз) для извлечения документа.

Смежные вопросы