2016-02-04 2 views
1

Формат сжатого файла Gzip, как известно, является сжатым файлом формата DEFLATE с дополнительными заголовками и нижним колонтитулом. Аналогично в случае с кодеком lzop, который является форматом LZO с дополнительными заголовками.Верхние и нижние колонтитулы сжатия Hadoop

Любая идея, что представляют собой эти верхние и нижние колонтитулы? Как я могу увидеть их содержимое?

Спасибо за ваше время.

ответ

1

Формат заголовка и прицепа gzip определен в RFC 1952.

+0

Спасибо за ответ. Это было довольно информативно. Перейдя по ссылке, у меня есть еще несколько вопросов. (1) Есть ли в файле Gzipped нижний колонтитул? (2) Являются ли заголовки [и нижний колонтитул (если есть)] именами-членами, такими как ID1, ID2 и т. Д., Остаются распространенными в разных форматах сжатия и отличаются только их значения? Мой второй вопрос поможет понять LZOP. – Marco99

+0

Вы не должны полностью читать RFC. Он описывает как заголовок, так и трейлер (нижний колонтитул). Прочтите RFC. Также отмечено в RFC, что вы не читали, так это то, что формат gzip используется только для одного сжатого формата, сбрасывания. Вы не обертываете данные LZO. –

+0

Мои комментарии, вероятно, были не очень ясными. На самом деле я прошел через RFC и не смог найти ни одного (названного) нижнего колонтитула/трейлера. Если в заголовках есть имена, такие как ID1, ID2. Я просто хотел знать, могут ли заголовки, обсуждаемые в RFC, применимы и к другим форматам сжатия, считая их «обобщенными заголовками». Спасибо за этот быстрый ответ. – Marco99