2013-05-28 3 views
0

Я пытаюсь использовать LangDetectLanguageIdentifierUpdateProcessorFactory, который поставляется с SOLR для обнаружения языков при индексировании документов. Это выглядит довольно простой реализации, я поставил следующее solrconfig.xmlSOLR 4.1 Обнаружение языка

<updateRequestProcessorChain> 
    <processor class="org.apache.solr.update.processor.LangDetectLanguageIdentifierUpdateProcessorFactory"> 
    <str name="langid.fl">title</str> 
    <str name="langid.langField">language_s</str> 
    <str name="langid.fallback">en</str> 
    <bool name="langid.map">true</bool> 
    <bool name="langid.map.individual">true</bool> 
    <str name="langid.map.individual.fl">title</str> 
    <str name="langid.whitelist">en, fr, de, it, ar, ja, zh-cn, zh-tw</str> 
    <bool name="langid.map.keepOrig">true</bool> 
    </processor> 
    <processor class="solr.LogUpdateProcessorFactory" /> 
    <processor class="solr.RunUpdateProcessorFactory" /> 
</updateRequestProcessorChain> 

, но когда я начала Solr он говорит, что не может загрузить класс LangDetectLanguageIdentifierUpdateProcessorFactory. Я также пробовал TikaLanguageIdentifierUpdateProcessorFactory, но не повезло. Я, вероятно, чего-то не хватает. Нужен ли мне дополнительный пакет/библиотека/классы для работы с несколькими языковыми возможностями в SOLR?

ответ

1

убедитесь, что у вас есть apache-solr-langid-X.X.jar и зависимые банки в contrib/langid/lib, доступные для solr.

+0

спасибо, что сработало – rusho1234

Смежные вопросы