Im используя карту hadoop и уменьшите программу. И мне нужно прочитать несколько файлов и выводит его на несколько файловмножественный выход файла в hadoop mapreduce streaming
Пример
Input \ one.txt
two.txt
three.txt
Output \
one_out.txt
two_out.txt
мне нужно, чтобы получить некоторые вещи, как это. Как я могу это достичь.
Пожалуйста, помогите мне
Благодаря
вы не можете управлять именами файлов, сгенерированных MR. Но если вы используете формат ввода файлов, каждый файл будет передан другому картографу, в конечном итоге создав отдельный выходной файл, если файл не будет достаточно большим. –
@AnkurShanbhag - Хорошо. Именование не имеет значения, мне нужно иметь отдельный файл o/p для каждого файла i/p – Backtrack