2012-04-26 2 views
3

My schema.xml разделяет имя продукта, а затем использует RemoveDuplicate для удаления дублированных слов после разделения.Почему solr RemoveDuplicatesTokenFilterFactory не работает?

<fieldType name="type_name" class="solr.TextField"> 
     <analyzer type="index"> 
      <tokenizer class="solr.PatternTokenizerFactory" pattern="\|| " /> 
      <filter class="solr.LowerCaseFilterFactory"/> 
      <filter class="solr.RemoveDuplicatesTokenFilterFactory"/> 

И в анализатор запросов я вижу, что RemoveDuplicatesTokenFilterFactory абсолютно ничего не сделал для дублированных слов. Зачем?

enter image description here

ответ

4

Если вы читаете Wiki вы увидите, что она только удаляет дубликаты в том же положении, что не в этом случае.

+0

Как дублировать существуют в одном и том же положении? Что может вызвать это? – wormhit

+2

Как и в Wiki, они вызывают токены в синонимах с похожим корнем, например. –

+1

и есть ли фильтр, который удаляет дубликат без учета позиции? – lulalala

Смежные вопросы