2016-11-13 2 views
0

Я пытаюсь проиндексировать некоторые XML-файлы в Solr 6.2.1, используя их DataImportHandler.Apache Solr DataImportHandler не пытается индексировать

Для этой цели я добавил необходимый импорт и этот RequestHandler в solrconfig.xml:

<lib dir="${solr.install.dir:../../../..}/contrib/dataimporthandler/lib/" regex=".*\.jar" /> 
    <lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-dataimporthandler-.*\.jar" /> 

    <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler" startup="lazy"> 
    <lst name="default"> 
     <str name="config">data-config.xml</str> 
    </lst> 
    </requestHandler> 

Тогда я написал данных-config.xml и положить его в тот же путь, как solrconfig.xml :

<dataConfig> 
    <dataSource type="FileDataSource" encoding="UTF-8"/> 
    <document> 
     <entity name="pickupdir" 
       processor="FileListEntityProcessor" 
       dataSource="null" 
       baseDir="/vagrant/TREC8all/Adhoc/" 
       recursive="true" 
       fileName="^[\w\d-]+\.xml$" /> 
     <entity name="trec8_simple" 
       processor="XPathEntityProcessor" 
       stream="true" 
       datasource="pickupdir" 
       url="${pickupdir.fileAbsolutePath}" 
       forEach="/DOCS/DOC"> 
      <field column="id" xpath="/DOCS/DOC/DOCNO"/> 
      <field column="header" xpath="/DOCS/DOC/HEADER"/> 
      <field column="text" xpath="/DOCS/DOC/TEXT"/> 
     </entity> 
    </document> 
</dataConfig> 

Это должно сделать ImportHandler итерации рекурсивно через все XML-файлы в каталоге и индексировать их в соответствии с XPaths.

Когда я называю RequestHandler как это: (Я бегу Solr в бродячей поле вместо локально)

http://192.168.155.156:8983/solr/trec8/dataimport?command=full-import&entity=trec8_simple 

Я получаю это исключение в solr.log:

ERROR (Thread-14) [ x:trec8] o.a.s.h.d.DataImporter Full Import failed:java.lang.NullPointerException 
     at org.apache.solr.handler.dataimport.DataImporter.createPropertyWriter(DataImporter.java:325) 
     at org.apache.solr.handler.dataimport.DataImporter.doFullImport(DataImporter.java:412) 
     at org.apache.solr.handler.dataimport.DataImporter.runCmd(DataImporter.java:475) 
     at org.apache.solr.handler.dataimport.DataImporter.lambda$runAsync$0(DataImporter.java:458) 
     at java.lang.Thread.run(Thread.java:745) 

Im предполагая, что это должно быть источником для DataImportHandler:

https://github.com/sudarshang/lucene-solr/blob/master/solr/contrib/dataimporthandler/src/java/org/apache/solr/handler/dataimport/DataImporter.java

Мне трудно понять, что вызывает это исключение и что это значит. Было бы хорошо, если бы кто-нибудь мог мне помочь. Благодаря!

EDIT: Я думаю, что это имеет какое-то отношение к DataImportHandler, которое не может найти data-config.xml. Когда я удалю его, вы получите то же исключение

ответ

0

Хорошо, я нашел проблему! Проблема была в solrconfig,

<lst name="default"> 
    <str name="config">data-config.xml</str> 
</lst> 

должен был

<lst name="defaults"> 
    <str name="config">data-config.xml</str> 
</lst> 
Смежные вопросы