2014-08-31 4 views
1

Можем ли мы индексировать ВАКР файлы непосредственно в Solr без извлечения и хранения некоторые промежуточные файлы (напр. HTML формат) из ВАКР файлы сначала на жестком диске?Можем ли мы проиндексировать файлы WARC напрямую в Solr?

Другими словами, можем ли мы индексировать эти файлы, не сохраняя ничего на жестких дисках?

ответ

0

Вы должны сделать это на клиенте, так как неясно, какую схему вы хотите использовать для этих файлов. Затем вы можете просто расширить содержимое в памяти потоковым способом, обработать его с помощью Tika на стороне клиента, если потребуется, и отправить любое представление документа, которое вы хотите Solr.

Смежные вопросы