2015-04-10 6 views
1

Я читаю столбцы из HBase и индексируя его в Solr с помощью файла морфий. Некоторые значения полей будут на английском или немецком языке. Есть ли способ указать тип поля как «text_english_german» и внутри определения «text_english_german» мы можем выполнить проверку состояния, чтобы узнать, является ли это английским или немецким языком, и использовать специализированную фабрику фильтров Stemmer для индексирования и запроса данные?Apache Solr: условный блок

Спасибо, Кишор

ответ

0

С несколько иной подход, можно определить два поля:

  • text_en
  • text_de

Каждый из них будет иметь определенный язык текстовый анализ. Затем вы можете использовать автоопределение языка UpdateRequestProcessor [1]. Там много параметров, где вы можете настроить поведение такого компонента.


[1] https://wiki.apache.org/solr/LanguageDetection
[2] https://cwiki.apache.org/confluence/display/solr/Detecting+Languages+During+Indexing

+0

Спасибо Андреа за быстрый ответ, я проверю и дам вам знать. –