У меня есть следующие поля в моей SOLR Configure:Игнорировать специальные символы
<fieldType name="title" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" preserveOriginal="1" catenateAll="1" splitOnCaseChange="0"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
в поле я мог быть хранящей:
Человек-паук, Человек-паук, Человек-паук
Что бы например, для тех, кто ищет паука, чтобы получить все 3 варианта, и в идеале тот, кто ищет человека-паука, получит все 3 варианта. Помимо внесения изменений в контент, когда он индексируется, есть ли другой способ эффективно игнорировать специальные символы, но не обязательно разделять на них?