Мне нужно загрузить много файлов на моем кластере (+/- 500 000), и это занимает очень много времени. Каждый файл находится в формате gzip и занимает 80 Мб места.Оптимизация для hadoop с большим количеством мелких файлов
На данный момент я использую время цикл для загрузки моего файла с путы, но у вас есть, может быть, лучшее решение ...
Спасибо за вашу порцию.
Да, ваша ссылка довольно интересная. Спасибо вам! – KelevraZero