У меня есть много и много файлов для загрузки на сервер, и я просто хочу, чтобы избежать дубликатов.Создание уникального ключа на основе содержимого файла в python
Таким образом, генерирование уникального и небольшого значения ключа из большой строки казалось чем-то, что должна была иметь контрольная сумма, и hashing seemed like the evolution of that.
Так что я собирался использовать hash md5 для этого. Но затем я прочитал somewhere, что «MD5 не предназначены для уникальных ключей», и я подумал, что это действительно странно.
Каков правильный способ сделать это?
редактировать: кстати, я взял twosources, чтобы добраться до следующего, который, как я сейчас делаю это, и это работает просто отлично, с Python 2.5:
import hashlib
def md5_from_file (fileName, block_size=2**14):
md5 = hashlib.md5()
f = open(fileName)
while True:
data = f.read(block_size)
if not data:
break
md5.update(data)
f.close()
return md5.hexdigest()
Используйте «f = open (fileName, 'rb')», чтобы получить правильные результаты в Windows – DLRdave