2013-07-19 2 views
1

Мне нужно сделать некоторые преобразования в документах, прежде чем индексировать их в solr. но тексты поступают из разных ресурсов, и для индексирования сложно сделать преобразования, потому что мне придется адаптировать несколько программ для анализа файлов. Я подумываю проиндексировать их в solr, извлекать текстовые поля, делать преобразования и снова переделывать.Как извлечь solr index docs

Я пробовал:

curl 'http://localhost:8983/solr/collection1/select?q=*&rows=20000&wt=xml&indent=true' 

, но на выходе получается результат XML-файл, в то время как я искал какой-нибудь способ, чтобы извлечь документы с полями, как в формате проводки. Это возможно? как я должен это делать?

Благодаря

ответ

0

Я рекомендовал бы использовать один из клиентов Solr, перечисленных на странице Integrating Solr. Это позволит вам использовать свой язык программирования для извлечения и преобразования документов Solr, а затем перезагрузить их в индекс.

Смежные вопросы