Как объединить все файлы в каталоге HDFS, которые, как мне известно, сжаты, в один сжатый файл, без копирование данных через локальную машину? Например, но не обязательно, используя Pig?Слияние сжатых файлов на HDFS
В качестве примера у меня есть папка/данные/ввод, содержащий файлы part-m-00000.gz и part-m-00001.gz. Теперь я хочу объединить их в один файл /data/output/foo.gz
Но я хочу избежать передачи данных назад и вперед в локальную файловую систему. – matthiash