2015-04-21 3 views
1

У меня есть экземпляр solr и работает, и он должен читать файлы паркета для индексации. Прямо сейчас я конвертирую паркет в текстовый файл, а затем с помощью solr индексирует их. Я хотел бы узнать, можно ли прочитать файл паркета непосредственно для использования Solr?Solr indexing parquet file

Thanks

ответ

0

Непосредственно: нет, невозможно.

Если вы хотите что-то более интегрированной, чем то, что вы на самом деле делают (преобразование в текст и индексации может быть уже достаточно хорошо), вы можете следовать двумя путями:

  1. Создать специализированный код вокруг DIH, вы, вероятно, может написать специализированный DataSource, поэтому вы можете использовать DIH для индексирования.
  2. Просто написать некоторый Java-код с помощью SolrJ, который считывает файл и индексы для Solr
+0

Спасибо, PERSI. Я надеялся на более прямой подход. Но этот подход мог бы стать способом. Я займусь этим. – Marty