Я разрабатываю карту/Уменьшает использование Hadoop. Моя программа драйверов отправляет задание MapReduce (с картой и сокращает задание) в поисковый трекер Hadoop. У меня есть два вопроса: a) Может ли моя карта или уменьшить задачу отправить другую работу MapReduce? (с тем же кластером Hadoop и с тем же Job Tracker). Это означает, что моя программа-драйвер для начинающих представляет задание mapreduce, в котором его карта или задача уменьшают задание MapReduce и отправляют его в тот же кластер Hadoop и в тот же список Job Tracker. Я думаю, это возможно. Но я не уверен. Более того, это хорошее решение? Если нет, можем ли мы иметь другое решение?Карта Уменьшить на пояс Уменьшить
б) Можно ли использовать две задачи карты (с помощью двух различных функций и одной Уменьшить задачу в работе MapReduce? Большое спасибо
Что это вы пытаетесь достичь, начав работу MapReduce внутри задания MapReduce? –
У меня есть два больших набора данных ввода (set1 и set2). Для каждого элемента записи set1 мне нужны все элементы множеств 2 для его обработки. Поэтому я намереваюсь, чтобы моя программа драйвера отправляла set1 в качестве входных данных для задания mapreduce. Затем в Map Task, чтобы обработать элемент записи из set1, я намерен отправить другое задание mapReduce, чьи входные данные установлены2. Я не знаю, возможно это или нет. Я думаю, что это возможно теоретически, но невозможно, потому что ни один слот не доступен. Возможно, если моя функция Map представит другое задание MapReduce в другой кластер Hadoop с другим JobTracker? –