2010-12-28 5 views
3

Мне нужно иметь возможность распаковывать через PHP некоторые данные, которые у меня есть в строке, которая использует формат gzip. Мне нужно сделать это через PHP, а не путем вызова через system, например, - внешней программы.Декомпрессия файла .gz через PHP

Я перехожу к документации, и я нахожу gzdecode. Жаль, что этого не существует. Копаясь дальше через google, похоже, эта функция была реализована в PHP6, которую я не могу использовать. (Интересно, gzencode существует и работает).

Я верю - но я не уверен, что формат gzip просто содержит некоторые дополнительные данные заголовка. Есть ли способ распаковать его, манипулируя этими дополнительными данными, а затем используя gzuncompress или каким-либо другим способом?

Благодаря

ответ

2

gzdecode() еще не на PHP. Но вы можете использовать реализацию от upgradephp. Это всего лишь несколько дополнительных байтов заголовков.

Другой вариант - использовать gzopen. Возможно, точно так же, как gzopen("data:app/bin,....").

+0

Спасибо. Я буду использовать их реализацию, поскольку я доверяю ей больше, чем тот, который я нашел в комментариях к документам PHP. – frm

+0

@frm: Я думаю, что комментарий от комментариев тоже будет работать. Выглядит хорошо. На самом деле он выглядит более полным, даже проверяя контрольную сумму. – mario

+0

Я вижу, я буду использовать этот. знак равно – frm

1

Ну, я нашел ответ, прочитав комментарии на странице gzdecode, которую я связал в своем оригинальном посте. Один из пользователей, Aaron G, обеспечил его реализацию, и он работает:

<?php 

function gzdecode($data) { 
    $len = strlen($data); 
    if ($len < 18 || strcmp(substr($data,0,2),"\x1f\x8b")) { 
    return null; // Not GZIP format (See RFC 1952) 
    } 
    $method = ord(substr($data,2,1)); // Compression method 
    $flags = ord(substr($data,3,1)); // Flags 
    if ($flags & 31 != $flags) { 
    // Reserved bits are set -- NOT ALLOWED by RFC 1952 
    return null; 
    } 
    // NOTE: $mtime may be negative (PHP integer limitations) 
    $mtime = unpack("V", substr($data,4,4)); 
    $mtime = $mtime[1]; 
    $xfl = substr($data,8,1); 
    $os = substr($data,8,1); 
    $headerlen = 10; 
    $extralen = 0; 
    $extra  = ""; 
    if ($flags & 4) { 
    // 2-byte length prefixed EXTRA data in header 
    if ($len - $headerlen - 2 < 8) { 
     return false; // Invalid format 
    } 
    $extralen = unpack("v",substr($data,8,2)); 
    $extralen = $extralen[1]; 
    if ($len - $headerlen - 2 - $extralen < 8) { 
     return false; // Invalid format 
    } 
    $extra = substr($data,10,$extralen); 
    $headerlen += 2 + $extralen; 
    } 

    $filenamelen = 0; 
    $filename = ""; 
    if ($flags & 8) { 
    // C-style string file NAME data in header 
    if ($len - $headerlen - 1 < 8) { 
     return false; // Invalid format 
    } 
    $filenamelen = strpos(substr($data,8+$extralen),chr(0)); 
    if ($filenamelen === false || $len - $headerlen - $filenamelen - 1 < 8) { 
     return false; // Invalid format 
    } 
    $filename = substr($data,$headerlen,$filenamelen); 
    $headerlen += $filenamelen + 1; 
    } 

    $commentlen = 0; 
    $comment = ""; 
    if ($flags & 16) { 
    // C-style string COMMENT data in header 
    if ($len - $headerlen - 1 < 8) { 
     return false; // Invalid format 
    } 
    $commentlen = strpos(substr($data,8+$extralen+$filenamelen),chr(0)); 
    if ($commentlen === false || $len - $headerlen - $commentlen - 1 < 8) { 
     return false; // Invalid header format 
    } 
    $comment = substr($data,$headerlen,$commentlen); 
    $headerlen += $commentlen + 1; 
    } 

    $headercrc = ""; 
    if ($flags & 1) { 
    // 2-bytes (lowest order) of CRC32 on header present 
    if ($len - $headerlen - 2 < 8) { 
     return false; // Invalid format 
    } 
    $calccrc = crc32(substr($data,0,$headerlen)) & 0xffff; 
    $headercrc = unpack("v", substr($data,$headerlen,2)); 
    $headercrc = $headercrc[1]; 
    if ($headercrc != $calccrc) { 
     return false; // Bad header CRC 
    } 
    $headerlen += 2; 
    } 

    // GZIP FOOTER - These be negative due to PHP's limitations 
    $datacrc = unpack("V",substr($data,-8,4)); 
    $datacrc = $datacrc[1]; 
    $isize = unpack("V",substr($data,-4)); 
    $isize = $isize[1]; 

    // Perform the decompression: 
    $bodylen = $len-$headerlen-8; 
    if ($bodylen < 1) { 
    // This should never happen - IMPLEMENTATION BUG! 
    return null; 
    } 
    $body = substr($data,$headerlen,$bodylen); 
    $data = ""; 
    if ($bodylen > 0) { 
    switch ($method) { 
     case 8: 
     // Currently the only supported compression method: 
     $data = gzinflate($body); 
     break; 
     default: 
     // Unknown compression method 
     return false; 
    } 
    } else { 
    // I'm not sure if zero-byte body content is allowed. 
    // Allow it for now... Do nothing... 
    } 

    // Verifiy decompressed size and CRC32: 
    // NOTE: This may fail with large data sizes depending on how 
    //  PHP's integer limitations affect strlen() since $isize 
    //  may be negative for large sizes. 
    if ($isize != strlen($data) || crc32($data) != $datacrc) { 
    // Bad format! Length or CRC doesn't match! 
    return false; 
    } 
    return $data; 
} 

?>