После один день кишит Nutch (1.4) ... наконец я получил плохой плохой ниже исключением:IOExeption при сканировании с Nutch
.
.
.
-finishing thread FetcherThread, activeThreads=0
-activeThreads=0, spinWaiting=0, fetchQueues.totalSize=0
-activeThreads=0
Fetcher: java.io.IOException: Job failed!
at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:1252)
at org.apache.nutch.fetcher.Fetcher.fetch(Fetcher.java:1204)
at org.apache.nutch.fetcher.Fetcher.run(Fetcher.java:1240)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
at org.apache.nutch.fetcher.Fetcher.main(Fetcher.java:1213)
.
.
.
я 20 новостей сайта и входной аргумент Nutch является: глубина 3 и TopN -1 я иметь достаточно места в корневом каталоге моего Linux и около 4 Гб оперативной памяти , как я могу решить эту проблему? спасибо.
Я указал большое пространство на мой/tmp, но ничего не изменилось и произошло то же самое исключение. Есть ли какая-то неправильная конфигурация? – hadi
Я не уверен, что еще может быть неправильно, но можете ли вы убедиться, что у вас еще не закончилось пространство? Посмотрите, сколько данных у вас есть в папке tmp и убедитесь, что у вас нет больше указанного вами пространства. – Kiril
да, я указал около 100 ГБ пространства в/из linux – hadi