Приложение «Мой поиск» использует Solr для поиска по контенту wikis и форумов. Иногда вульгарные слова появляются в сообщениях, и поэтому они индексируются в Solr и появляются также в предложениях и поисках.Solr - игнорировать предопределенные слова
Есть ли способ для Solr игнорировать набор предопределенных слов, которые считаются вульгарными?
В этом случае пользовательский вопрос будет следующим. Мы имеем:
A) схема как:
<field name="id" type="string" indexed="true" stored="true" required="true" />
<field name="title" type="string" indexed="true" stored="true" >
<field name="body" type="string" indexed="true" stored="true" >
В) текстовый файл, содержащий вульгарные слова, игнорировать: words_to_ignore.txt. Например, он будет содержать:
badword1 badword2
C) вика, имеющие название "мои вика badword1";
Если мы запустили запрос:
http://localhost:8983/my_wiki_collection/select?q=name:(wiki+AND+badword1)
Мы ожидаем, что Solr вернуть документ:
<doc>
<str name="id">abcd-acdf-a1ga</str>
<str name="name">my wiky</str>
<str name="body">This is my amazing wiki</str>
</doc>