Я пытаюсь использовать LangDetectLanguageIdentifierUpdateProcessorFactory
, который поставляется с SOLR для обнаружения языков при индексировании документов. Это выглядит довольно простой реализации, я поставил следующее solrconfig.xmlSOLR 4.1 Обнаружение языка
<updateRequestProcessorChain>
<processor class="org.apache.solr.update.processor.LangDetectLanguageIdentifierUpdateProcessorFactory">
<str name="langid.fl">title</str>
<str name="langid.langField">language_s</str>
<str name="langid.fallback">en</str>
<bool name="langid.map">true</bool>
<bool name="langid.map.individual">true</bool>
<str name="langid.map.individual.fl">title</str>
<str name="langid.whitelist">en, fr, de, it, ar, ja, zh-cn, zh-tw</str>
<bool name="langid.map.keepOrig">true</bool>
</processor>
<processor class="solr.LogUpdateProcessorFactory" />
<processor class="solr.RunUpdateProcessorFactory" />
</updateRequestProcessorChain>
, но когда я начала Solr он говорит, что не может загрузить класс LangDetectLanguageIdentifierUpdateProcessorFactory
. Я также пробовал TikaLanguageIdentifierUpdateProcessorFactory
, но не повезло. Я, вероятно, чего-то не хватает. Нужен ли мне дополнительный пакет/библиотека/классы для работы с несколькими языковыми возможностями в SOLR?
спасибо, что сработало – rusho1234