2015-02-18 3 views
0

о проверке целостности файлов, я не уверен, что контрольная сумма CRC32 или MD5 генерирует «непредсказуемые» хэш-значения:У MD5 и CRC генерируются «непредсказуемые» значения хэша?

При проверке идентичности файлов обычно используется контрольная сумма CRC32 или MD5. Это означает, что каждый файл, который, возможно, является дубликатом другого, считывается от начала до конца, и уникальный номер будет рассчитываться на основе его уникального двоичного содержимого. В качестве отпечатка пальца это число сохраняется и используется для сравнения содержимого файла с другими файлами, чтобы определить, действительно ли они идентичны. Это означает, что крошечное изменение в файле приводит к довольно большому и «непредсказуемому» изменению генерируемого хеша.

+0

В чем вопрос? Что вы пытаетесь сделать с предсказуемостью контрольных сумм? – Nelson

+0

Вы ответили на свой вопрос. Вы правы, когда говорите: «Это означает, что крошечное изменение в файле приводит к довольно большому и« непредсказуемому »изменению генерируемого хэша». –

ответ

0

Это неправильное использование термина «непредсказуемый». Алгоритмы детерминированы, что означает, что они всегда будут выдавать одинаковый выход с одним и тем же входом. Поэтому они вполне предсказуемы.

Да, для небольшого изменения входа приведет к «довольно большому изменению» на выходе порядка порядка половины битов выхода.

Эти проверки не могут использоваться, чтобы определить, действительно ли два файла «идентичны». Они могут только указывать, что существует очень высокая вероятность того, что оба файла идентичны. Вам нужно будет напрямую сравнить два файла, чтобы определить, действительно ли они идентичны.

С другой стороны, если проверки отличаются друг от друга, то вы точно знаете, что файлы отличаются.

Смежные вопросы