2013-08-16 2 views
0

Я бегу Nutch 2.2.1 на Eclipse, Juno SR1 и JRE 1.7.0_25Nutch ОШИБКА tika.TikaParser на Затмении

Стадию PARSE терпит неудачу с этой ошибкой:

2013-08-15 19:35:26,555 ERROR tika.TikaParser - Can't retrieve Tika parser for mime-type application/pdf 
2013-08-15 19:35:26,557 WARN parse.ParseUtil - Unable to successfully parse content 

Похоже, это ошибка происходит из TikaConfig.java, потому что я получаю пустой итератор:

Iterator<Parser> iterator = ServiceRegistry.lookupProviders(
    Parser.class, this.getClass().getClassLoader()); 

То же PARSE звонка от CYGWIN успешен, я получаю все парсер из реестра службы. Поэтому, возможно, решение конфигурации Eclipse, связанные с Service registry.

Nutch-Eclipse, хорошо настроен о Nutch-site.xml, разобрать-plugins.xml

Я признателен за любую идею решить эту проблему.

+1

У вас есть все банки Тика, и их dependecies правильно на вашем пути к классам? – Gagravarr

+0

Да, у меня есть все зависимости от пути и порядка сборки, также используя тот же путь класса cygwin для аргументов VM. Тот же результат. – Osy

ответ

0

Заканчивать эту тему, кажется, что он имел подобную проблему и решить ее:

http://lucene.472066.n3.nabble.com/Nutch-2-x-Eclipse-Can-t-retrieve-Tika-parser-for-mime-type-application-pdf-td4015896.html

+0

Спасибо @Allan, не было моей проблемой точно, потому что у меня не было парса синтаксиса tika в локальном/lib dir, однако это помогло мне выяснить, как исправить мой путь к классам, включая папку для плагина parser-tika в eclipse. – Osy

Смежные вопросы