2010-06-02 2 views
0

Что я хочу сделать, это проиндексировать некоторые документы в Solr и знать, как это работает. Я установил Solr и Tomcat и могу видеть пользовательский интерфейс Solr Admin на localhost: 8080/solr/admin/ Теперь я хочу добавить некоторые документы в индекс, могу ли я узнать, как продолжить дальше? В этом отношении я нахожу очень мало документации по этому вопросу. В учебнике http://lucene.apache.org/solr/tutorial.html#Indexing+Data они попросили запустить команду java -jar post.jar solr.xml monitor.xml, но после запуска я получил сообщение об ошибке отказа, так как это причал. После установки пристани я попробовал telnet: Я получил сообщение "Connection failed"Файлы индексирования проблем в Solr on Ubuntu

Я не могу понять, в чем проблема.

+0

Вы должны указать правильный URL-адрес, включая порт #, в процедуру post. – bmargulies

ответ

2

Как ручных состояния, есть несколько способов индексирования данных в Solr:

  • Импорта записи из базы данных с помощью Data Import Handler (DIH).
  • Load a CSV file (значения, разделенные запятой), в том числе экспортированные Excel илиMySQL.
  • Индексные двоичные документы, такие как Word и PDF, с Solr Cell (ExtractingRequestHandler).
  • Используйте SolrJ для Java или других Solr clients, чтобы программно создать документы для отправки в Solr.

post.jar сценарий не кажется, что они предназначаются для других марок, кроме тестирования. Это просто упрощенная реализация клиента Solr (обработка только импорта XML).

Для этой цели я успешно использовал DIH и (PHP) Solr-клиент. Первый - это расширение для Solr, которое позволяет сопоставить ваш источник данных (в моем случае MySQL) с индексом Solr. Настройка его в базовой форме не составляет труда, и это довольно хорошо объясняется в DataImportHandler section of the Solr Wiki. Если вы предпочитаете контролировать процесс индексирования (или его часть) на уровне программного обеспечения, вы можете создать собственное приложение, которое использует один из existing clients.

Я предлагаю вам попробовать один из этих вариантов.