Я пытался исследовать, как работает solr, когда документы, такие как doc или pdf, отправляются на него. Я хочу знать, могу ли я отправить pdf-файлы в solr, не удалось ли сохранить файл pdf вместе с индексом, созданным после разбора файла pdf?Apache Solr - сами документы хранятся отдельно от индекса?
Спасибо,
-Keshav
Или сохраните pdf-файл в файловой системе и сохраните его местоположение в поле «Сохранено». –
Mikos, Спасибо за ваш ответ! Вы упомянули, что текстовое содержимое PDF может быть сохранено. Но нужно ли хранить текстовое хранилище для поиска индекса? – Keshav
Не требуется для поиска. Но если вам нужно выделить (фрагменты), тогда вам нужно будет сохранить. – Mikos