2010-04-30 3 views
2

Итак, некоторый алгоритм для генерации уникального, разумного имени файла длины на основе содержимого двоичного файла. Два файла с одним и тем же двоичным содержимым должны иметь одно и то же имя. Очевидно, что для этого были бы ограничения, поскольку, по-видимому, у вас не было бы уникальных имен наименьших размеров для каждого большого набора больших файлов, отличающихся только небольшим количеством бит. Но, по-видимому, существует некоторое эвристическое, наилучшее приближение к этому, которое, например, использует известные атрибуты типичных файлов изображений. Если бы у меня было имя какого-то алгоритма, который делает это, я могу google и найти другие подходы.имена файлов на основе содержимого файла

ответ

5

Использование файла MD5 hash содержимого файла.

+0

хеширование - право. Спасибо – Mark

+0

На самом деле мне пришло в голову, что я использую библиотеку FreImage для создания этих файлов из растрового изображения для создания файла jpg или png. Каковы шансы, что эти файлы уже помечены воедино с таким хэшированным идентификатором. – Mark

+0

FreeImage Library – Mark

2

Я думаю, что MD5 стоит проверить. Конечно, это даст вам тот же результат, если контент будет тем же, но я думаю, вы можете увеличить его до тех пор, пока не получите уникальный.

+0

Это то, что я хочу, чтобы это сделать - дать одно и то же имя для одного и того же контента. – Mark

+0

Ну, тогда MD5 - это именно то, что вам нужно. Его не сложно найти исходный код, также я уверен, вы можете найти множество небольших инструментов командной строки, которые будут хешировать md5. – m0s

+0

спросите, и вы получите - этот форум поражает (хотя мне нужно было что-то вроде хэширования). – Mark

Смежные вопросы