2008-11-20 2 views
387

Я ищу, чтобы использовать Java для получения контрольной суммы MD5 файла. Я был очень удивлен, но я не смог найти ничего, что показывает, как получить контрольную сумму MD5 файла.Получение контрольной суммы MD5 в Java

Как это делается?

+0

Возможно, [это] (http://www.devdaily.com/java/jwarehouse/hsqldb/src/org/hsqldb/lib/MD5.java.shtml «MD5 Java»). Вы также можете найти спецификацию, но это займет больше времени, поскольку это сложно. – waynecolvin 2008-11-20 03:49:00

ответ

453

Там же входной поток декоратор, java.security.DigestInputStream, так что вы можете вычислить дайджест, используя входной поток, как обычно, вместо того, чтобы сделать дополнительный проход над данными.

MessageDigest md = MessageDigest.getInstance("MD5"); 
try (InputStream is = Files.newInputStream(Paths.get("file.txt")); 
    DigestInputStream dis = new DigestInputStream(is, md)) 
{ 
    /* Read decorated stream (dis) to EOF as normal... */ 
} 
byte[] digest = md.digest(); 
+4

Я согласен, очень элегантный способ вычисления контрольной суммы на лету, если вы уже что-то делаете с байтами (т. Е. Читаете их на входе от HTTP-соединения). – 2008-12-06 01:51:44

+0

+1 для реализации потока. @Marc не должен просто быть потоком HTTP, потоки java io - это каждый вкус, о котором можно подумать; т. е. этот метод будет полезен в самых разных сценариях. – 2012-06-09 07:24:34

+0

Более элегантный, чем выбранный ответ. Благодаря! – hsanders 2012-07-13 14:24:24

137

Приводится пример в Real's Java-How-to с использованием класса MessageDigest.

Проверьте эту страницу на примерах с использованием CRC32 и SHA-1.

import java.io.*; 
import java.security.MessageDigest; 

public class MD5Checksum { 

    public static byte[] createChecksum(String filename) throws Exception { 
     InputStream fis = new FileInputStream(filename); 

     byte[] buffer = new byte[1024]; 
     MessageDigest complete = MessageDigest.getInstance("MD5"); 
     int numRead; 

     do { 
      numRead = fis.read(buffer); 
      if (numRead > 0) { 
       complete.update(buffer, 0, numRead); 
      } 
     } while (numRead != -1); 

     fis.close(); 
     return complete.digest(); 
    } 

    // see this How-to for a faster way to convert 
    // a byte array to a HEX string 
    public static String getMD5Checksum(String filename) throws Exception { 
     byte[] b = createChecksum(filename); 
     String result = ""; 

     for (int i=0; i < b.length; i++) { 
      result += Integer.toString((b[i] & 0xff) + 0x100, 16).substring(1); 
     } 
     return result; 
    } 

    public static void main(String args[]) { 
     try { 
      System.out.println(getMD5Checksum("apache-tomcat-5.5.17.exe")); 
      // output : 
      // 0bb2827c5eacf570b6064e24e0e6653b 
      // ref : 
      // http://www.apache.org/dist/ 
      //   tomcat/tomcat-5/v5.5.17/bin 
      //    /apache-tomcat-5.5.17.exe.MD5 
      // 0bb2827c5eacf570b6064e24e0e6653b *apache-tomcat-5.5.17.exe 
     } 
     catch (Exception e) { 
      e.printStackTrace(); 
     } 
    } 
} 
+60

... Да еще он-лайн через 11 лет! :-) – RealHowTo 2008-11-21 02:41:07

+0

Пример в Java-How-To от Real отлично работает и прост в реализации. – bakoyaro 2011-06-27 14:30:06

12

Недавно я должен был сделать это для всего динамической строки, MessageDigest может представлять хэш различными способами. Для того, чтобы получить подпись файла, как вы бы получить с помощью команды md5sum я должен был сделать что-то вроде этого:

try { 
    String s = "TEST STRING"; 
    MessageDigest md5 = MessageDigest.getInstance("MD5"); 
    md5.update(s.getBytes(),0,s.length()); 
    String signature = new BigInteger(1,md5.digest()).toString(16); 
    System.out.println("Signature: "+signature); 

} catch (final NoSuchAlgorithmException e) { 
    e.printStackTrace(); 
} 

Это, очевидно, не отвечает на вопрос о том, как это сделать конкретно для файла , вышеупомянутый ответ имеет дело с этим тихим красиво. Я просто потратил много времени на то, чтобы получить сумму, чтобы она выглядела так, как показывает большинство приложений, и думала, что вы столкнулись с такой же проблемой.

+0

Подпись представляет собой дайджест в шестнадцатеричном формате. Я тоже нашел шестнадцатеричное представление для работы, где, как вы говорите, другие представления не работают. Спасибо, что поставили это. – 2009-10-12 09:33:35

238

Использование DigestUtils из Apache Commons Codec библиотеки:

FileInputStream fis = new FileInputStream(new File("foo")); 
String md5 = org.apache.commons.codec.digest.DigestUtils.md5Hex(fis); 
fis.close(); 
+0

Не работает для меня в моем коде Android. Я получаю эту ошибку ... java.lang.NoSuchMethodError: org.apache.commons.codec.binary.Hex.encodeHexString at org.apache.commons.codec.digest.DigestUtils .md5Hex (DigestUtils.java:215) – JPM 2012-05-01 21:03:14

+0

@JPM Предположим, вы уже загрузили и поделили `commons-codec.jar` на свой путь к классам? – 2012-05-01 21:07:24

+0

да там и я экспортировал в моем проекте андроида. Я могу пройти через код, а класс есть в исходных файлах ... странно, должно быть, проблема с проблемой андроида Eclipse. – JPM 2012-05-01 21:08:52

2

Если вы используете ANT, чтобы построить, это мертвые просто. Добавьте следующую строку в ваш build.xml:

<checksum file="${jarFile}" todir="${toDir}"/> 

Где jarFile является JAR вы хотите, чтобы сгенерировать MD5 против, и toDir является каталог, который вы хотите поместить файл MD5.

More info here.

5
public static String MD5Hash(String toHash) throws RuntimeException { 
    try{ 
     return String.format("%032x", // produces lower case 32 char wide hexa left-padded with 0 
     new BigInteger(1, // handles large POSITIVE numbers 
      MessageDigest.getInstance("MD5").digest(toHash.getBytes()))); 
    } 
    catch (NoSuchAlgorithmException e) { 
     // do whatever seems relevant 
    } 
} 
7

Мы использовали код, похожий код, указанный выше в предыдущем посте, используя

... 
String signature = new BigInteger(1,md5.digest()).toString(16); 
... 

Однако, следить за использование BigInteger.toString() здесь, так как это усечение ведущих нулей .. (например, попробуйте s = "27", контрольная сумма должна быть "02e74f10e0327ad868d138f2b4fdd6f0")

Во-вторых, предложение использовать Apache Commons Codec, я заменил наш собственный код на это.

+1

Ничего себе, я искал проблему, когда материал MD5 отлично работал для всего, за исключением того, что файл выдавал нам только 31 шестнадцатеричный вывод, и он терпел неудачу в md5checksums. что усечение ведущих 0s - огромная боль ... Спасибо за ваше примечание. – Mike 2012-03-01 18:11:11

78

com.google.common.hash В API предлагает:

  • единый удобный API для всех хэш-функций
  • Seedable 32- и 128-битных реализаций murmur3
  • md5(), sha1(), SHA256(), sha512(), измените только одну строку кода, чтобы переключаться между ними и шуметь.
  • goodFastHash (INT бит), когда вы не волнует, что алгоритм используется
  • Общие утилиты для экземпляров Hashcode, как combineOrdered/combineUnordered

Прочитайте руководство пользователя (IO Explained, Hashing Explained).

Для вашего прецедента Files.hash() вычисляет и возвращает значение дайджеста для файла.

Например переваривать расчет (изменение SHA-1 MD5, чтобы получить контрольную сумму MD5)

HashCode hc = Files.asByteSource(file).hash(Hashing.sha1()); 
"SHA-1: " + hc.toString(); 

Обратите внимание, что гораздо быстрее, чем , поэтому используйте , если вам не нужно криптографически безопасного контрольная сумма , Обратите также внимание на то, что не следует использовать для хранения паролей и т. Д., Так как это легко для перебора, для паролей вместо этого используются , или .

Для обеспечения долгосрочной защиты с помощью хэшей Merkle signature scheme добавляет безопасность. Исследовательская комиссия Post Quantum Cryptography, спонсируемая Европейской комиссией, рекомендовала использовать эту криптографию для долгосрочной защиты от квантовых компьютеров (ref).

Заметим, что у была более высокая скорость удара, чем другие.

30

Guava теперь обеспечивает новый, последовательный хеширования API, который является гораздо более удобным, чем различные хэширования API, предоставленных в JDK. См. Hashing Explained. Для файла, вы можете получить сумму MD5, CRC32 (с версии 14.0+) или многих других хэшей легко:

HashCode md5 = Files.hash(file, Hashing.md5()); 
byte[] md5Bytes = md5.asBytes(); 
String md5Hex = md5.toString(); 

HashCode crc32 = Files.hash(file, Hashing.crc32()); 
int crc32Int = crc32.asInt(); 

// the Checksum API returns a long, but it's padded with 0s for 32-bit CRC 
// this is the value you would get if using that API directly 
long checksumResult = crc32.padToLong(); 
10
public static void main(String[] args) throws Exception { 
    MessageDigest md = MessageDigest.getInstance("MD5"); 
    FileInputStream fis = new FileInputStream("c:\\apache\\cxf.jar"); 

    byte[] dataBytes = new byte[1024]; 

    int nread = 0; 
    while ((nread = fis.read(dataBytes)) != -1) { 
     md.update(dataBytes, 0, nread); 
    }; 
    byte[] mdbytes = md.digest(); 
    StringBuffer sb = new StringBuffer(); 
    for (int i = 0; i < mdbytes.length; i++) { 
     sb.append(Integer.toString((mdbytes[i] & 0xff) + 0x100, 16).substring(1)); 
    } 
    System.out.println("Digest(in hex format):: " + sb.toString()); 
} 

Или вы можете получить больше информации http://www.asjava.com/core-java/java-md5-example/

20

Ok. Я должен был добавить. Одна реализация линия для тех, у кого уже есть Spring и Apache Commons зависимость или планируют добавить:

DigestUtils.md5DigestAsHex(FileUtils.readFileToByteArray(file)) 

Для и Apache Commons единственный вариант (кредит @duleshi):

DigestUtils.md5Hex(FileUtils.readFileToByteArray(file)) 

Надеюсь, что это поможет кому-то ,

5

Standard Java Runtime Environment way:

public String checksum(File file) { 
    try { 
    InputStream fin = new FileInputStream(file); 
    java.security.MessageDigest md5er = 
     MessageDigest.getInstance("MD5"); 
    byte[] buffer = new byte[1024]; 
    int read; 
    do { 
     read = fin.read(buffer); 
     if (read > 0) 
     md5er.update(buffer, 0, read); 
    } while (read != -1); 
    fin.close(); 
    byte[] digest = md5er.digest(); 
    if (digest == null) 
     return null; 
    String strDigest = "0x"; 
    for (int i = 0; i < digest.length; i++) { 
     strDigest += Integer.toString((digest[i] & 0xff) 
       + 0x100, 16).substring(1).toUpperCase(); 
    } 
    return strDigest; 
    } catch (Exception e) { 
    return null; 
    } 
} 

Результат равен полезности Linux md5sum.

2

Google guava предоставляет новый API.Найдите ниже:

public static HashCode hash(File file, 
      HashFunction hashFunction) 
        throws IOException 

Computes the hash code of the file using hashFunction. 

Parameters: 
    file - the file to read 
    hashFunction - the hash function to use to hash the data 
Returns: 
    the HashCode of all of the bytes in the file 
Throws: 
    IOException - if an I/O error occurs 
Since: 
    12.0 
1
public static String getMd5OfFile(String filePath) 
{ 
    String returnVal = ""; 
    try 
    { 
     InputStream input = new FileInputStream(filePath); 
     byte[]  buffer = new byte[1024]; 
     MessageDigest md5Hash = MessageDigest.getInstance("MD5"); 
     int   numRead = 0; 
     while (numRead != -1) 
     { 
      numRead = input.read(buffer); 
      if (numRead > 0) 
      { 
       md5Hash.update(buffer, 0, numRead); 
      } 
     } 
     input.close(); 

     byte [] md5Bytes = md5Hash.digest(); 
     for (int i=0; i < md5Bytes.length; i++) 
     { 
      returnVal += Integer.toString((md5Bytes[i] & 0xff) + 0x100, 16).substring(1); 
     } 
    } 
    catch(Throwable t) {t.printStackTrace();} 
    return returnVal.toUpperCase(); 
} 
37

Использование NiO2 (Java 7+) и никаких внешних библиотек:

byte[] b = Files.readAllBytes(Paths.get("/path/to/file")); 
byte[] hash = MessageDigest.getInstance("MD5").digest(b); 

сравнить результат с ожидаемым контрольной суммы:

String expected = "2252290BC44BEAD16AA1BF89948472E8"; 
String actual = DatatypeConverter.printHexBinary(hash); 
System.out.println(expected.equalsIgnoreCase(actual) ? "MATCH" : "NO MATCH"); 
19

Простой подход без сторонних библиотек с использованием Java 7

String path = "your complete file path"; 
MessageDigest md = MessageDigest.getInstance("MD5"); 
md.update(Files.readAllBytes(Paths.get(path))); 
byte[] digest = md.digest(); 

Если вам нужно напечатать этот массив байтов. Использовать как указано ниже

System.out.println(Arrays.toString(digest)); 

Если вам нужна шестнадцатеричная строка из этого дайджеста. Используйте ниже

String digestInHex = DatatypeConverter.printHexBinary(digest).toUpperCase(); 
System.out.println(digestInHex); 

где DatatypeConverter является javax.xml.bind.DatatypeConverter

5

Очень быстрый & чистый Java-метод, который не зависит от внешних библиотек:

(Просто замените MD5 с SHA -1, SHA-256, SHA-384 или SHA-512, если вы хотите те)

public String calcMD5() throws Exception{ 
     byte[] buffer = new byte[8192]; 
     MessageDigest md = MessageDigest.getInstance("MD5"); 

     DigestInputStream dis = new DigestInputStream(new FileInputStream(new File("Path to file")), md); 
     try { 
      while (dis.read(buffer) != -1); 
     }finally{ 
      dis.close(); 
     } 

     byte[] bytes = md.digest(); 

     // bytesToHex-method 
     char[] hexChars = new char[bytes.length * 2]; 
     for (int j = 0; j < bytes.length; j++) { 
      int v = bytes[j] & 0xFF; 
      hexChars[j * 2] = hexArray[v >>> 4]; 
      hexChars[j * 2 + 1] = hexArray[v & 0x0F]; 
     } 

     return new String(hexChars); 
} 
4
String checksum = DigestUtils.md5Hex(new FileInputStream(filePath)); 
4

Вот простая функция, которая обертывает код Сунила, так что он принимает файл в качестве параметра. Функция не нуждается в каких-либо внешних библиотек, но это требует Java 7.

import java.io.File; 
import java.io.IOException; 
import java.nio.file.Files; 
import java.security.MessageDigest; 
import java.security.NoSuchAlgorithmException; 

import javax.xml.bind.DatatypeConverter; 

public class Checksum { 

    /** 
    * Generates an MD5 checksum as a String. 
    * @param file The file that is being checksummed. 
    * @return Hex string of the checksum value. 
    * @throws NoSuchAlgorithmException 
    * @throws IOException 
    */ 
    public static String generate(File file) throws NoSuchAlgorithmException,IOException { 

     MessageDigest messageDigest = MessageDigest.getInstance("MD5"); 
     messageDigest.update(Files.readAllBytes(file.toPath())); 
     byte[] hash = messageDigest.digest(); 

     return DatatypeConverter.printHexBinary(hash).toUpperCase(); 
    } 

    public static void main(String argv[]) throws NoSuchAlgorithmException, IOException { 
     File file = new File("/Users/foo.bar/Documents/file.jar");   
     String hex = Checksum.generate(file); 
     System.out.printf("hex=%s\n", hex);    
    } 


} 

Пример вывода:

hex=B117DD0C3CBBD009AC4EF65B6D75C97B