Я новичок в Solr, и я извлекаю метаданные из двоичных файлов через URL-адреса, хранящиеся в моей базе данных. Я хотел бы знать, какие поля доступны для индексирования из PDF-файлов (те, которые будут инициированы как column = ""). Я также хотел бы знать, как создавать настраиваемые поля в Solr. Как это реализовано и сопоставлено с конкретными метаданными, поступающими из файлов. Если у кого-то есть фрагмент кода, который мог бы показать мне, это было бы весьма признательно. Спасибо заранее.Solr metadata index
0
A
ответ
0
Чтобы создать пользовательские поля в Solr, вам необходимо будет изменить файл schema.xml
для установки Solr. Файл schema.xml, который поставляется вместе с примером Solr, включенным в дистрибутив (найденный в папке/example), содержит большое количество предопределенных полей метаданных для извлечения файлов. Для получения информации о создании пользовательских полей в Solr, обратитесь к следующему:
Solr имеет встроенный обработчик запроса для извлечения и отображения метаданных из бинарных файлов. Для получения дополнительной информации, пожалуйста, Referer к следующему:
Смежные вопросы
- 1. solr index подкатегория
- 2. Solr: Index csv file
- 3. building solr словарь index
- 4. Replcating Schemaless SOLR Index
- 5. Append to Solr Index
- 6. отображение Тика Solr Metadata игнорировать заголовок документа
- 7. Solr single index vs Solr multi core
- 8. Дублирует термины на solr index
- 9. Multi-Language Solr Search Index
- 10. Solr delete Index using cURL
- 11. solr-index из нескольких папок
- 12. solr index issue on EC2
- 13. обновление Solr от Lucene Index
- 14. Apache Solr index rebuild notification
- 15. Как извлечь solr index docs
- 16. Sunspot Solr index time boost
- 17. Как использовать array_slice в этом типе $ _POST ['MetaData'] ['video_title'] [$ index]
- 18. Solr Spellcheck index не реплицируется на подчиненный
- 19. solr index java исходные файлы как текст
- 20. Solr Index Стратегия для Q & A сайтов
- 21. Как читать данные из solr/data/index
- 22. Solr Index с использованием файлов Avro
- 23. Haystack and Solr- Fai To Clear Index
- 24. Как добавить java entites в Solr Index?
- 25. Index pdf file content using Apache Solr
- 26. extract .jpg metadata/metadata-extractor/exif/java
- 27. Javafx metadata
- 28. WebPart "metadata"?
- 29. ffmpeg metadata
- 30. UIAlertView Metadata
Привет Paige, спасибо большое за ваш ответ. Я хочу иметь возможность индексировать, не используя команду curl. Мой код настроен на динамическое индексирование. Не могли бы вы привести мне пример того, как я могу извлечь что-то вроде размера файла, формата или типа файла? Какими будут имена столбцов, которые будут относиться к этим типам полей? Кроме того, мне интересно, есть ли у вас небольшой фрагмент кода о том, как сопоставить настраиваемые поля. Должен ли я объявить это в файле solrconfig.xml или сделать еще несколько настроек в другом месте? – Luis
Пример кода см. В этой ссылке из вики-файла Solr - http://wiki.apache.org/solr/ContentStreamUpdateRequestExample. Что касается имен столбцов, обратитесь к примеру и соответствующим образом скорректируйте параметры в файле schema.xml, используя ссылки выше в качестве ссылки. –