Есть ли способ управлять выходными именами файлов задания Hadoop Streaming? В частности, я хотел бы, чтобы содержимое и имя выходных файлов моей работы были организованы с помощью кетных выходов редуктора - каждый файл будет содержать только значения для одного ключа, и его имя будет ключевым.Как управлять именем выходных файлов и содержимым потоковой передачи Hadoop?
Обновление: Только что нашел ответ - Использование класса Java, который происходит из MultipleOutputFormat, поскольку формат выходных данных позволяет управлять именами выходных файлов. http://hadoop.apache.org/core/docs/current/api/org/apache/hadoop/mapred/lib/MultipleOutputFormat.html
Я не видел каких-либо образцов для этого там ... Можно ли указать на образец Hadoop Streaming, который использует формат пользовательского вывода Java класса?
Неработающая ссылка на новые документы –