Я бегу Nutch 2.2.1 на Eclipse, Juno SR1 и JRE 1.7.0_25Nutch ОШИБКА tika.TikaParser на Затмении
Стадию PARSE терпит неудачу с этой ошибкой:
2013-08-15 19:35:26,555 ERROR tika.TikaParser - Can't retrieve Tika parser for mime-type application/pdf
2013-08-15 19:35:26,557 WARN parse.ParseUtil - Unable to successfully parse content
Похоже, это ошибка происходит из TikaConfig.java, потому что я получаю пустой итератор:
Iterator<Parser> iterator = ServiceRegistry.lookupProviders(
Parser.class, this.getClass().getClassLoader());
То же PARSE звонка от CYGWIN успешен, я получаю все парсер из реестра службы. Поэтому, возможно, решение конфигурации Eclipse, связанные с Service registry.
Nutch-Eclipse, хорошо настроен о Nutch-site.xml, разобрать-plugins.xml
Я признателен за любую идею решить эту проблему.
У вас есть все банки Тика, и их dependecies правильно на вашем пути к классам? – Gagravarr
Да, у меня есть все зависимости от пути и порядка сборки, также используя тот же путь класса cygwin для аргументов VM. Тот же результат. – Osy