В конфигурационных файлах Solr я определил DataImportHandler, который извлекает данные из базы данных Mysql, а также обрабатывает содержимое файлов PDF, связанных с регистрами базы данных SQL. Импорт данных отлично работает.Обнаружение языка Solr с использованием DataImportHandler
Я пытаюсь определить язык текста, содержащийся в файлах, во время фазы импорта данных. Я указал в свой файл solrconfig.xml a TikaLanguageIdentifierUpdateProcessorFactory
, как описано в https://wiki.apache.org/solr/LanguageDetection, и в моей схеме документа определил поля языка, тем не менее, после запуска индексации от администратора Solr я не вижу поля языка в моих документах.
Во всех примерах, которые я видел, обнаружение языка выполняется путем публикации документа в solr с помощью команды post, возможно ли сделать обнаружение языка с помощью DataImportHandler?
спасибо. Он работает нормально. –