Я пытался распаковать zip-файл, хранящийся в файловой системе Hadoop, & сохранил его обратно в файловой системе hadoop. Я пробовал следующие команды, но никто из них не работал.Как распаковать файл в hadoop?
hadoop fs -cat /tmp/test.zip|gzip -d|hadoop fs -put - /tmp/
hadoop fs -cat /tmp/test.zip|gzip -d|hadoop fs -put - /tmp
hadoop fs -cat /tmp/test.zip|gzip -d|hadoop put - /tmp/
hadoop fs -cat /tmp/test.zip|gzip -d|hadoop put - /tmp
Я получаю ошибки как gzip: stdin has more than one entry--rest ignored
, cat: Unable to write to output stream.
, Error: Could not find or load main class put
на терминале, когда я запускаю эти команды. Любая помощь?
Редактировать 1: У меня нет доступа к пользовательскому интерфейсу. Таким образом, разрешены только командные строки. Утилиты unzip/gzip устанавливаются на моей машине hadoop. Я использую версию Hadoop 2.4.0
.
AFAIK, единственный ваниль путь сделать это было бы, чтобы получить файл вашей локальной машины, разархивировать его и отправить обратно в кластер. – fxm
У меня нет такой свободы: | – Abhishek
Считаете ли вы [это решение?] (Http://stackoverflow.com/questions/15256808/unzip-files-using-hadoop -streaming) – fxm