2015-04-24 2 views
0

Я не уверен, что это исправлено для новых версий Hadoop, но в настоящее время я заблокирован для запуска Hadoop 0.20 (устаревший код).Hadoop 0.20: задание «job setup»

Возникла проблема: при запуске задания Hadoop есть задача «Настройка задания», которую нужно запустить в первую очередь. Мне кажется, что Hadoop случайным образом выбирает эту задачу как задачу карты или задачу уменьшения.

У нас больше возможностей для задач карты, чем сокращение задач, поэтому всякий раз, когда мне становится не повезло и у меня своя задача запуска, на мою работу требуется даже начало работы. Любые идеи, как преодолеть это?

ответ

0

Работа Hadoop сначала завершает всю задачу вашего картографа. Как только все задание картографа будет завершено, он перейдет через сеть и будет перемещаться и сортироваться, и только после этого ваша задача редуктора начнет обработку. Поэтому я думаю, что для этой задержки может быть какая-то другая.

+0

«Настройка задания» выполняется перед картой или уменьшает фазы как отдельную задачу. Я вижу, что настройка задания случайным образом является либо картой, либо сокращением задачи. – sydraz

+0

Можете ли вы опубликовать журнал, как работает ваша задача задания, поскольку, насколько я знаю, сначала ваш картограф будет завершен – salmanbw

Смежные вопросы