2016-10-01 2 views
2

, когда я пытаюсь запустить, появляется следующая ошибка, В журналах mongodb одно соединение принято и заканчивается немедленно. Как решить проблему?

$ bin/crawl conf/urls/seeds.txt tuto 1 Не указано SOLRURL. Пропуск индексации. URL-адрес для вливания семян /e/apache-nutch/apache-nutch-2.3.1/runtime/local/bin/nutch inject conf/urls/seeds.txt -crawlId tuto InjectorJob: от 2016-10-01 18: 15:14 InjectorJob: Injecting urlDir: conf/urls/seeds.txt InjectorJob: Использование класса org.apache.gora.mongodb.store.MongoStore как класс хранения Gora. InjectorJob: java.lang.NullPointerException на java.lang.ProcessBuilder.start (ProcessBuilder.java:1010) на org.apache.hadoop.util.Shell.runCommand (Shell.java:482) на org.apache. hadoop.util.Shell.run (Shell.java:455) at org.apache.hadoop.util.Shell $ ShellCommandExecutor.execute (Shell.java:702) at org.apache.hadoop.util.Shell.execCommand (Shell.java:791) at org.apache.hadoop.util.Shell.execCommand (Shell.java:774) at org.apache.hadoop.fs.RawLocalFileSystem.setPermission (RawLocalFileSystem.java:646) at org. apache.hadoop.fs.RawLocalFileSystem.mkdirs (RawLocalFileSystem.java:434) at org.apache.hadoop.fs.FilterFileSystem.mkdirs (FilterFileSystem.java:281) на org.apache.hadoop.mapreduce.JobSubmissionFiles.getStagingDir (JobSubmissionFiles.java:125) в org.apache.hadoop.mapreduce.JobSubmitter.submitJobInternal (JobSubmitter.java:348) в org.apache.hadoop.mapreduce. Job $ 10.run (Job.java:1285) at org.apache.hadoop.mapreduce.Job $ 10.run (Job.java:1282) at java.security.AccessController.doPrivileged (родной метод) at javax.security .auth.Subject.doAs (Subject.java:415) at org.apache.hadoop.security.UserGroupInformation.doAs (UserGroupInformation.java:1614) at org.apache.hadoop.mapreduce.Job.submit (Job.java : 1282) at org.apache.hadoop.mapreduce.Job.waitForCompletion (Job.java:1303) at org.apache.nutch.util.Nutc hJob.waitForCompletion (NutchJob.java:115) на org.apache.nutch.crawl.InjectorJob.run (InjectorJob.java:231) на org.apache.nutch.crawl.InjectorJob.inject (InjectorJob.java:252) at org.apache.nutch.crawl.InjectorJob.run (InjectorJob.java:275) at org.apache.hadoop.util.ToolRunner.run (ToolRunner.java:70) at org.apache.nutch.crawl. InjectorJob.main (InjectorJob.java:284)Ошибка: при запуске Apache nutch с mongodb

ответ

0

Я считаю, что новая версия Nutch использует

# bin/nutch inject seedDirectory/ 

Это работало для меня по крайней мере.

0

Я решил эту проблему, просто удалив две линии т.е .:

[field name="sitemaps" docfield="sitemaps" type="document"] 

и

[field name="stmPriority" docfield="stmPriority" type="int32"] 

из gora-mongodb-mapping.xml файла в папке conf Nutch. Надеюсь, это поможет вам.

Смежные вопросы