2012-05-31 2 views
1

Im использование solr-sunburnt с django. Я использовал nutch для сканирования и индексации моего сайта. Я скопировал гайку schema.xml в solr.Solr-Sunburnt-Nutch. содержимое поля отсутствует в результатах

Проблема, с которой я столкнулся, заключается в том, что когда я отправляю запрос, результаты не содержат в них поля содержимого.

Результаты одинаковы, независимо от того, запрашиваю ли я из sunburnt или непосредственно solr (из браузера: 8983/solr/select).

Что мне нужно сделать, чтобы получить содержимое поля в моих результатах

P.S. Я новичок, когда дело доходит до поиска и поиска. :)

+0

попробуйте 'q = *: *', чтобы увидеть все, начиная с SOlr. И подумайте об индексировании, а не обскакивайте свой собственный сайт. – aitchnyu

+0

. Запрос '*: *' от solr/admin возвращает все результаты, но все же без поля ** content ** ... – PhoenixDev

+0

Ну, команда возвращает каждое поле для каждого документа (с учетом пределов разбивки на страницы). Поле 'content' ** не индексировано **. Пожалуйста, устраните неполадку. – aitchnyu

ответ

1

Спасибо за подсказку aitchnyu22.

Поэтому причина: content раздел не указан в результатах; заключается в том, что он не получил индексацию в первую очередь.

Причина не индексируется, потому, что schema.xml файл, который копируется из Nutch в Solr, имеет параметр множества content поля к false по умолчанию stored.

После того, как вы измените это на true и повторно проиндексируете с нуля, в результатах поиска должно появиться поле content.

+0

Сохраненный мой день. Спасибо :) –

0

Так поле должно быть

<field name="content" type="text" stored="true" indexed="true"/> 

ли это быть установлен верно для Nutch, Solr или оба? Конечно, в обоих местах должно быть одинаково, но какой компонент действительно использует этот флаг?

Смежные вопросы