Я работаю над простой программой уменьшения масштаба. Я хочу создать разные файлы после редуктора для каждого слова в ключе. Например, после выполнения MapReduce у меня есть что-то вродеНесколько выходных данных в редукторе
Приоритета 1 х 2
Приоритет 1 у 2
Приоритет 1 г 2
priority2 х 2
priority2 у 2
сейчас Я хочу разные файлы после фазы уменьшения, говоря Priority1 и Priority2, которые имеют все эти значения в соответствии с приоритетом. Я использую java и хочу знать, что должно быть написано в редукторе для получения такого вывода?
Я просто хочу знать, возможно ли это, или если это, как подойти или решить это? Я использую Hadoop 0.20.203, и поэтому множественные выходы не работают.
Любые указатели будут полезны. Спасибо за помощь! Atul
В частности, когда вы создаете выходной формат, как именно вы обрабатываете создание нового файла для каждого слова? Обычно выходные файлы создаются при вызове OutputFormat.getRecordWriter (контекст), так как бы вы знали, что назвать файл? – Huckle