У меня есть 4 файла на hdfs.Число Mappers
1.txt, 2.txt, 3.txt и 4.txt. Из этих 4 файлов первые 3 файла содержат данные, как указано ниже, и файл 4.txt пуст. Как могут выполняться преобразования.
Число копий = количество входных разрывов.
Мой вопрос: все ли эти файлы хранятся в одном блоке 64 МБ или 4 разных блоках? поскольку данные для каждого файла меньше 64 МБ.
1.txt Это текстовый файл 1
2.txt Это текстовый файл 2
3.txt Это текстовый файл, 3
4.txt "Пустой"