2013-03-14 7 views
0

Я новичок в Solr, и я извлекаю метаданные из двоичных файлов через URL-адреса, хранящиеся в моей базе данных. Я хотел бы знать, какие поля доступны для индексирования из PDF-файлов (те, которые будут инициированы как column = ""). Я также хотел бы знать, как создавать настраиваемые поля в Solr. Как это реализовано и сопоставлено с конкретными метаданными, поступающими из файлов. Если у кого-то есть фрагмент кода, который мог бы показать мне, это было бы весьма признательно. Спасибо заранее.Solr metadata index

ответ

0

Чтобы создать пользовательские поля в Solr, вам необходимо будет изменить файл schema.xml для установки Solr. Файл schema.xml, который поставляется вместе с примером Solr, включенным в дистрибутив (найденный в папке/example), содержит большое количество предопределенных полей метаданных для извлечения файлов. Для получения информации о создании пользовательских полей в Solr, обратитесь к следующему:

Solr имеет встроенный обработчик запроса для извлечения и отображения метаданных из бинарных файлов. Для получения дополнительной информации, пожалуйста, Referer к следующему:

+0

Привет Paige, спасибо большое за ваш ответ. Я хочу иметь возможность индексировать, не используя команду curl. Мой код настроен на динамическое индексирование. Не могли бы вы привести мне пример того, как я могу извлечь что-то вроде размера файла, формата или типа файла? Какими будут имена столбцов, которые будут относиться к этим типам полей? Кроме того, мне интересно, есть ли у вас небольшой фрагмент кода о том, как сопоставить настраиваемые поля. Должен ли я объявить это в файле solrconfig.xml или сделать еще несколько настроек в другом месте? – Luis

+0

Пример кода см. В этой ссылке из вики-файла Solr - http://wiki.apache.org/solr/ContentStreamUpdateRequestExample. Что касается имен столбцов, обратитесь к примеру и соответствующим образом скорректируйте параметры в файле schema.xml, используя ссылки выше в качестве ссылки. –