2014-01-23 2 views
0

Предположим, у меня есть файл в формате PDF, содержащий информацию как CV -Index и поиск файла мне нужно

Имя: хуг DOB: 11/11/1980 электронная почта: [email protected]

объективном : хуг а ....

навыки: C++ C Java XML и т.д.

образования: колледжа имя университет Результат: 9

опыт работы/техническая деятельность/Стажировки: а XYZ Защита ...

деятельность/интересы/спорт: а ..

Ссылка: хуг Декларации: здесь .....


Я хочу индексировать похожие pdf-файлы в solr. Я новичок в этом. Так может кто-нибудь настаивать на мне, что именно мне нужно делать. способ индексирования. Я просто знаю, что мне нужно использовать команду curl. Но я не знаю изменения или дополнения wat, которые я должен внести в schma.xml и solrconfig.xml, чтобы индексировать этот файл и запрашивать некоторые точные вещи.

Я хочу выполнить некоторые задачи, такие как поиск имен людей, у которых есть java как их навыки. , и мне просто нужно, чтобы их имена и навыки отображались в результате.

Пожалуйста, помогите мне. Заранее спасибо

ответ

0

В Solr вы храните свои данные в виде документа Solr. Каждый документ состоит из id и нескольких полей. Для каждого поля вы можете хранить свои данные.

  1. Read here и разработать свою собственную схему. У вас должны быть все поля, по которым вы хотите выполнить запрос.
  2. Индекс ваших данных в Solr. После 2 URL-адресов вы узнаете, как индексировать данные и извлекать документы. http://wiki.apache.org/solr/UpdateXmlMessages http://wiki.apache.org/solr/ExtractingRequestHandler
  3. Наконец query

Надежда они будут в состоянии вести Вас.

+0

Извините, что задал основной вопрос. В приведенном выше примере я должен добавить поля в файл schema.xml? это так? Пожалуйста, помогите мне в отношении вышеизложенного. файла pfd Заранее спасибо – vidz

+0

Да. Во-первых, уточните, какие типы запросов вы будете делать для каждого типа данных. Затем добавьте поле к вашему schema.xml с соответствующим типом поля. – buddy86

+0

Хорошо спасибо .. Это все? Нужно ли добавлять что-либо еще в файл solrconfig.xml или в любые другие файлы? – vidz

Смежные вопросы