Я хотел индексировать текстовые файлы. После долгих поисков я узнал об Apache tika. Теперь на некоторых сайтах, где я изучал Apache tika, я узнал, что Apache tika преобразует текст в формат XML, а затем отправляет его в solr. Но при преобразовании он создает только один пример тега ....... Теперь текстовым файлом, который я хочу индексировать, является файл доступа локального хоста tomcat. Этот файл находится в ГБ. Я не могу сохранить его и один индекс. Я хочу, чтобы каждая строка имела идентификатор строки ....... Так что я могу легко получить соответствующую строку.Как индексировать текстовые файлы с помощью apache solr
Можно ли это сделать в Apache Tika?
Извините, что сменил вопрос. После поиска я узнал, что вы предложили, поэтому я ИЗМЕНИЛ ВОПРОС БИТ. Вы знаете ответ за это? –
обновил ответ. – Jayendra
"* Вам либо нужно подать весь файл в качестве входа в solr *" Можете ли вы обновить свой вопрос на примере того, как это сделать? –