2014-10-23 3 views
0

У меня есть текстовый файл. Прежде всего, как я могу его проиндексировать? Также есть некоторые конкретные термины в файле, я хочу сделать синтаксический анализ этих файлов, например, если я индексирую файл TEXT, его содержимое сохраняется как есть, обрабатывается ли оно solr или нет?Индексные текстовые файлы в solr line by

Если не разобрано (для некоторых уникальных терминов в текстовом файле), то как я могу это сделать. Я узнал, что с помощью скрипта post.sh вы можете его индексировать, но он предназначен только для файлов xml, а не для текстовых файлов!

ответ

0

Это не технический вопрос. Вы должны сделать шаг назад и спросить себя, что вы хотите найти. Один файл соответствует одному результату или многим. Если многие, то что такое результат.

Затем вы должны увидеть, откуда идут файлы. Вы нажимаете их на Solr или получаете Solr для их вытаскивания (из базы данных или файловой системы).

Это дает вам возможность выяснить, как задать гораздо лучший и более конкретный вопрос. Например, чтобы прочитать файл строки за строкой в ​​режиме pull, вы можете посмотреть на DataImportHandler с FileDataSource и LineEntityProcessor.

Смежные вопросы