Я пытаюсь начать работу с Apache Solr, но некоторые вещи мне не понятны. Чтение через tutorial, я создал запущенный экземпляр Solr. Я сбиваю с толку то, что вся конфигурация Solr (схемы и т. Д.) Находится в формате XML. Когда они добавляют примеры данных, он показывает, как добавить XML-документы (java -jar post.jar solr.xml monitor.xml
). Это просто плохой выбор формата выборки? Я имею в виду, они загружают данные, описывающие документы, или фактические документы, которые они добавляют, являются .xml-файлами?Начало работы с Solr
Я пытаюсь добавить некоторые книги в формате .txt, поэтому, если я использую java -jar post.jar mydoc.txt
, добавляю ли я его? Как я могу добавить этот документ и метаданные (автор, название) об этом?
То есть, я попытался создать простую страницу Html размещать документы Solr:
<html>
<head></head>
<body>
<form action="http://localhost:8983/solr/update?commit=true" enctype="multipart/form-data" method="post">
<input type="file">
<input type="submit" value="Send">
</form>
</body>
</html>
Когда я пытаюсь отправить файл, я получаю такой ответ:
<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">26</int>
</lst>
</response>
Is это правильно? Означает ли это, что я успешно добавил файл? Если это так, одно из слов в файле, например, «montagna» (это итальянская книга, montagna означает гору ...). Если я посетить URL-адрес
http://localhost:8983/solr/select/?q=montagna&start=0&rows=10&indent=on
Я ожидаю, что что-то должно быть возвращено (весь текст, может быть, или некоторую информацию о файле), но это то, что я получаю:
<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">1</int>
<lst name="params">
<str name="indent">on</str>
<str name="start">0</str>
<str name="q">montagna</str>
<str name="rows">10</str>
</lst>
</lst>
<result name="response" numFound="0" start="0"/>
</response>
Не кажется как матч со мной. Кроме того, согласно to this answer, я должен иметь возможность вернуть текст, окружающий матчи, hl.fragsize
. Как интегрировать это в строку поиска? Спасибо