Я пытаюсь выполнить карту уменьшить код, как показано ниже:Hadoop Streaming с помощью питона
hadoop jar /usr/lib/Hadoop/Hadoop-streaming-0.20.2-cdh3u2.jar –file mapper.py –mapper mapper.py –file reducer.py – reducer reducer.py –input /user/training/samplypy.txt –ouput /user/training/pythonMR/output
становится ниже исключением -
Exception in thread "main" java.lang.ClassNotFoundException: –file
at java.net.URLClassLoader$1.run(URLClassLoader.java:366)
at java.net.URLClassLoader$1.run(URLClassLoader.java:355)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(URLClassLoader.java:354)
at java.lang.ClassLoader.loadClass(ClassLoader.java:423)
at java.lang.ClassLoader.loadClass(ClassLoader.java:356)
at java.lang.Class.forName0(Native Method)
at java.lang.Class.forName(Class.java:264)
at org.apache.hadoop.util.RunJar.main(RunJar.java:149)
Я использую Hadoop 1.0.3. Я пробовал с несколькими версиями Hadoop-потоковый баночка, как:
hadoop-streaming-0.20.2-cdh3u2.jar
hadoop-streaming-1.2.0.jar
hadoop-streaming.jar
Где находится документ, в котором говорится о выполнении этой команды? – gonbe
У вас есть набор переменных env $ HADOOP_HOME? – owen79
См. Это http://stackoverflow.com/questions/16701979/packaging-a-jython-program-in-an-executable-jar. – srikanth