В настоящее время я использую hadoop для обработки задачи подсчета для большого набора данных (около 3 концертов). Мне нужно подсчитать что-то, что заполняется в том же временном интервале. Например: подсчет числа записи с метками времени между 3 и 4 часами. Мне нужно, чтобы выход был непрерывным. Если в определенном временном интервале нет записи, я все равно хочу сохранить ее на выходе, например [3 am~4am, 0 records].Выполнение чего-либо перед запуском задачи карты
Для этого я придумал идею, что я могу поместить все временные интервалы со значениями 0 в вывод отображения, прежде чем начнется задача карты. Но я попробовал Google, и я не мог найти решения.
Итак, можно ли каким-либо образом передать что-либо перед запуском задачи карты? Я также буду признателен за любые новые идеи для достижения этой цели. Thanks
добавить входную выборку данных, которые вы и вы хотите вывести? – syadav
для ввода как: {[10 утра], [2 вечера, 2]}, а для вывода я хочу, например, такие, как {[10 утра], [11 утра0,0], [12 утра], [1 вечера, , [2 pm,2] ...} –