3
My schema.xml разделяет имя продукта, а затем использует RemoveDuplicate для удаления дублированных слов после разделения.Почему solr RemoveDuplicatesTokenFilterFactory не работает?
<fieldType name="type_name" class="solr.TextField">
<analyzer type="index">
<tokenizer class="solr.PatternTokenizerFactory" pattern="\|| " />
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
И в анализатор запросов я вижу, что RemoveDuplicatesTokenFilterFactory абсолютно ничего не сделал для дублированных слов. Зачем?
Как дублировать существуют в одном и том же положении? Что может вызвать это? – wormhit
Как и в Wiki, они вызывают токены в синонимах с похожим корнем, например. –
и есть ли фильтр, который удаляет дубликат без учета позиции? – lulalala