Я создаю простую систему мониторинга ввода-вывода для заданий MapReduce, написанных на Java. Поэтому на этапе Map задания я хочу регистрировать информацию о местонахождении обработанных данных.Какая реплика входного блока обрабатывается в mapper?
MapReduce job на этапе разделения процесса на этапе карты, который состоит из нескольких файловых блоков в HDFS. Этот блок имеет несколько (обычно 3) реплик.
Можно ли узнать, какие реплики этих блоков использовались при чтении в Mapper? Другими словами, могу ли я получить полный путь к конкретному файлу в локальной файловой системе, из которого читается Mapper?