Для определенной задачи MapManager MapReduce я уже выполнил полное время выполнения задачи mapper. В общем случае, картограф имеет три шага: (1) чтение ввода из HDFS или другого источника, такого как Amazon S3; (2) входные данные процесса; (3) записать промежуточный результат на локальный диск. Теперь мне интересно, можно ли узнать время, затрачиваемое каждым шагом.Hadoop задание для выполнения заданий с графическим интерфейсом
Моя цель - получить результат (1), сколько времени требуется, чтобы считыватели считывали данные с HDFS или S3. В результате просто указывается, как быстро читатель может прочитать. Это больше похоже на производительность ввода-вывода для картографа; (2) сколько времени требуется, чтобы обработчик обработал эти данные, это больше похоже на вычислительную способность задачи.
У кого-нибудь есть идеи, как получить эти результаты?
Спасибо.