Я настроил кластер Hadoop. И им с двумя машинами MA и MB Когда я запустить программу MapReduce, используя следующий кодhadoop - Уменьшение карты на нескольких кластере
hadoop jar /HDP/hadoop-1.2.0.1.3.0.0-0380/contrib/streaming/hadoop-streaming-1.2.0.1.3.0.0-0380.jar -mapper "python C:\Python33\mapper.py" -reducer "python C:\Python33\redu.py" -input "/user/XXXX/input/input.txt" -output "/user/XXXX/output/out20131112_09"
где: картографа - C: \ Python33 \ mapper.py и восстановитель C: \ Python33 \ redu.py в локальном диске MB в
UPDATE
Наконец я отследил вниз по ошибке.
MA- журнал ошибок
stderr logs
python: can't open file 'C:\Python33\mapper.py': [Errno 2] No such file or directory
java.lang.RuntimeException: PipeMapRed.waitOutputThreads(): subprocess failed with code 2
картографа - C: \ Python33 \ mapper.py и восстановитель C: \ Python33 \ redu.py в локальном диске ОЭ и не в MB
Теперь мне нужно скопировать мой м/г программы для MA или как должен я решить эту
Mapper ли
import sys
for line in sys.stdin:
line = line.strip()
keys = line.split()
for key in keys:
value = 1
print('%s \t %d' % (key, value))
см. Http://wiki.apache.org/hadoop/HowManyMapsAndReduces – alko
@alko на приведенной выше картинке, вы можете обнаружить, что входные данные разделены на несколько блоков в машине DEV144. .. Я прав? – Backtrack
из вашего журнала кажется, что на dev140 была успешно выполнена одна задача карты, и один из них 4 раза подряд. что противоречит вашему вопросу – alko