2010-09-11 6 views
2

Скажем, у меня есть документ, индексированную с помощью Apache Solr, который содержит эту строку:Нормализация юникода

Kluft Skrams Infor

Я хочу быть в состоянии найти это с поиском с помощью этого ключевого слова (обратите внимание на "и" - "ü"):

Kluft

Есть ли способ сделать это?

ответ

2

Использовать ASCIIFoldingFilterFactory для анализаторов индексов и запросов.

+1

Стоит отметить, что есть также [MappingCharFilterFactory] (http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#CharFilterFactories), который используется некоторыми популярными клиентами Solr. Я не уверен, что он предлагает какие-либо особые преимущества перед «ASCIIFoldingFilterFactory», что, безусловно, более полно. Иногда нам приходится делать обновления в нашем стандартном файле «mapping-ISOLatin1Accent.txt» в [Websolr] (http://websolr.com/) для размещения клиентов, которые используют «MappingCharFilterFactory». –

Смежные вопросы