Мне нужно сделать некоторые преобразования в документах, прежде чем индексировать их в solr. но тексты поступают из разных ресурсов, и для индексирования сложно сделать преобразования, потому что мне придется адаптировать несколько программ для анализа файлов. Я подумываю проиндексировать их в solr, извлекать текстовые поля, делать преобразования и снова переделывать.Как извлечь solr index docs
Я пробовал:
curl 'http://localhost:8983/solr/collection1/select?q=*&rows=20000&wt=xml&indent=true'
, но на выходе получается результат XML-файл, в то время как я искал какой-нибудь способ, чтобы извлечь документы с полями, как в формате проводки. Это возможно? как я должен это делать?
Благодаря