2014-01-29 6 views
0

В германских языках, таких как немецкие и голландские слова, часто склеиваются. Например, «контроль качества» становится «Qualitätskontrolle» (de) или «kwaliteitscontrole» (nl).Как искать на немецком/голландском языке сложные слова в Lucene?

Как я могу сделать поиск Lucene на таких склеенных словах самостоятельно? То есть если я ищу «qualität» или «контроле», я хочу найти «Qualitätskontrolle».

Похоже, есть фильтр для этого: DictionaryCompoundWordTokenFilter. Но как я могу подключить его к DutchAnalyzer и GermanAnalyzer для индексирования и поиска?

ответ

1

Вы должны написать свой собственный анализатор, чтобы включить фильтр.

Подкласс GermanAnalyzer, например, или напишите его с нуля и включите DictionaryCompoundWordTokenFilter в список фильтров.

Смежные вопросы