Обнаружение языка Solr с использованием DataImportHandler

В конфигурационных файлах Solr я определил DataImportHandler, который извлекает данные из базы данных Mysql, а также обрабатывает содержимое файлов PDF, связанных с регистрами базы данных SQL. Импорт данных отлично работает.Обнаружение языка Solr с использованием DataImportHandler

Я пытаюсь определить язык текста, содержащийся в файлах, во время фазы импорта данных. Я указал в свой файл solrconfig.xml a TikaLanguageIdentifierUpdateProcessorFactory, как описано в https://wiki.apache.org/solr/LanguageDetection, и в моей схеме документа определил поля языка, тем не менее, после запуска индексации от администратора Solr я не вижу поля языка в моих документах.

Во всех примерах, которые я видел, обнаружение языка выполняется путем публикации документа в solr с помощью команды post, возможно ли сделать обнаружение языка с помощью DataImportHandler?

источник

2015-10-25 Vb Dev

Как только вы определили цепочку UpdateRequestProcessor, вам необходимо указать ее в обработчике запроса (в этом случае DataImportHandler). Вы делаете это с параметром update.chain.

Кроме того, убедитесь, что вы включили LogUpdate and RunUpdate processors, иначе вы даже не индексируете.

источник

2015-10-27 22:54:02

спасибо. Он работает нормально. –

Обнаружение языка Solr с использованием DataImportHandler

ответ

Смежные вопросы