2012-06-13 3 views
0

Я новичок в Solr и есть несколько вопросов, чтобы просить помощи у более опытных людей:индекс мои собственные данные в Solr

  1. Я могу получить пример работает, однако, что именно начало. сотрясать?

  2. Я знаю, запустив «java -jar start.jar», я могу запустить solr. Но я запускаю эту команду после того, как я индексирую свои данные, а не данные образца? если нет, что мне делать, чтобы запустить собственный экземпляр solr с моими собственными проиндексированными данными?

  3. Мне нужно индексировать свои собственные данные образца, не связанные с данным примером solr вообще. Как именно я должен это делать? Должен ли я скопировать каталог примеров, а затем изменить поля в файле sechema.xml? должен ли я затем запустить post.sh, чтобы индексировать данные, как то, что я сделал, чтобы настроить пример solr?

Большое спасибо за помощь!

ответ

0

Шаги:

  1. Решают, какова будет структура документа у хранить в ГУМЗ. (Несколько напоминает создание схемы реляционной БД для одной таблицы).
  2. удалите пример ядра и создайте собственное ядро ​​с помощью этой схемы
  3. после того, как схема работает без ошибок (вы проверяете журналы сервера, на которых размещено приложение SOLR). Вы можете начать подавать данные, которые у вас есть, в SOLR. Вы отправляете его через HTTP в определенной структуре, которая задокументирована в SOLR Wiki. У разных фреймворков есть несколько классов, чтобы справиться с этим.

маркированы как вики, так как это слишком широкий ответ для тех, кто не удосужились RTFM ...

+0

спасибо за быстрый ответ! Я хотел бы начать с чего-то очень простого, текстового файла, который содержит (id, name, value) пары в каждой строке.Пример: 1001 Название Профессор, 1001 Имя Дженни, 1001 Широта -122, 1001 Долгота 34. Я начну с индексирования и маркировки поля Name. Согласно приведенным выше шагам, у меня все еще есть вопросы (пожалуйста, несите меня). (1) Что вы подразумеваете, удалив пример ядра? в каком каталоге вы ссылаетесь? (2) можете ли вы указать мне на wiki, где упоминается, как отправлять данные? – trillions

+0

начинайте здесь http://wiki.apache.org/solr/ –

0

Дорогой обычай индексации является сложной задачей, а не как я работал на нем всего несколько дней назад , Прежде всего, необходимо написать свой documnet является XML, CSV или JSON (формат, поддерживаемым в Solr), содержащие поля в соответствии с вашей schema.xml, а затем запустить следующую команду в примере/exampledocs

Для документа mydoc.xml

./post.sh mydoc.xml

если на выходе, значение состояния равно 0, то индексация прошла успешно и вы можете найти документ в Solr

Ссылка: http://www.solrtutorial.com/solr-in-5-minutes.html

0

Хотя вопрос старый, но я пишу для новых посетителей с той же проблемой. На вопрос нельзя ответить в нескольких словах. Вы должны понять, что такое Solr, что такое Solr Admin UI, зачем нам Solr вместо реляционной базы данных. Затем вы можете понять, как импортировать данные образца. Недавно я опубликовал две статьи, в том числе введение и импорт пробных данных, это может быть полезно для вас.

http://www.devtrainings.com/2017/03/apache-solr-introduction-and-server.html

http://www.devtrainings.com/2017/03/apache-solr-index-data-and-run-search.html

Смежные вопросы