2016-07-18 5 views
1

Приложение «Мой поиск» использует Solr для поиска по контенту wikis и форумов. Иногда вульгарные слова появляются в сообщениях, и поэтому они индексируются в Solr и появляются также в предложениях и поисках.Solr - игнорировать предопределенные слова

Есть ли способ для Solr игнорировать набор предопределенных слов, которые считаются вульгарными?

В этом случае пользовательский вопрос будет следующим. Мы имеем:

A) схема как:

<field name="id" type="string" indexed="true" stored="true" required="true" /> 
<field name="title" type="string" indexed="true" stored="true" > 
<field name="body" type="string" indexed="true" stored="true" > 

В) текстовый файл, содержащий вульгарные слова, игнорировать: words_to_ignore.txt. Например, он будет содержать:

badword1 badword2

C) вика, имеющие название "мои вика badword1";

Если мы запустили запрос:

http://localhost:8983/my_wiki_collection/select?q=name:(wiki+AND+badword1) 

Мы ожидаем, что Solr вернуть документ:

<doc> 
<str name="id">abcd-acdf-a1ga</str> 
<str name="name">my wiky</str> 
<str name="body">This is my amazing wiki</str> 
</doc> 

ответ

Смежные вопросы