Я попытался следовать за nutch tutorial, но у вас возникли проблемы с файлом schema.xml.Интеграция Apache Nutch и Solr
мне сказали в Nutch условии схемы для моего проекта, по сути это ...
cp ${NUTCH_RUNTIME_HOME}/conf/schema.xml ${APACHE_SOLR_HOME}/example/solr/conf/
Я раскрывал свой файл Solr в Tomcat и ошибкой я получаю, когда я иду на приборную панель Solr является
collection1: org.apache.solr.common.SolrException:org.apache.solr.common.SolrException:
Plugin init failure for [schema.xml] fieldType "text":
Plugin init failure for [schema.xml] analyzer/filter:
Error loading class 'solr.EnglishPorterFilterFactory'
Что относится к этому элементу в моем файле solrconfig.xml (я могу прокомментировать это, но не уверен, насколько это важно еще)
<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/>
Я отредактировал мой solrconfig.xml, чтобы попробовать и включал в себя ряд файлов .jar, которые приходят с Solr, в частности
<lib path="/etc/solr/collection1/libs/dist/solr-core-4.2.1.jar" />
<lib path="/etc/solr/collection1/libs/dist/solr-analysis-extras-4.2.1.jar" />
Но я не думаю, что они содержат недостающий класс «solr.EnglishPorterFilterFactory»
У кого-нибудь есть идея, почему это может не работать, или если я что-то пропустил? Я не разработчик Java кстати, нет сомнений в том, что будет что-то просто :)
UPDATE Выяснив, что схема имела некоторые старые классы которые ссылаются у меня был другой взгляд в Nutch/конф Т.Т. похоже, есть файл $ {NUTCH_RUNTIME_HOME} /conf/schema-solr4.xml, который, похоже, работает.
Не 100%, если это правильно, но эй ...
Также используется «$ {NUTCH_RUNTIME_HOME} /conf/schema-solr4.xml» вместо старой конфигурации – Carlton