имена файлов на основе содержимого файла

Итак, некоторый алгоритм для генерации уникального, разумного имени файла длины на основе содержимого двоичного файла. Два файла с одним и тем же двоичным содержимым должны иметь одно и то же имя. Очевидно, что для этого были бы ограничения, поскольку, по-видимому, у вас не было бы уникальных имен наименьших размеров для каждого большого набора больших файлов, отличающихся только небольшим количеством бит. Но, по-видимому, существует некоторое эвристическое, наилучшее приближение к этому, которое, например, использует известные атрибуты типичных файлов изображений. Если бы у меня было имя какого-то алгоритма, который делает это, я могу google и найти другие подходы.имена файлов на основе содержимого файла

источник

2010-04-30 Mark

Использование файла MD5 hash содержимого файла.

источник

2010-04-30 18:30:29

хеширование - право. Спасибо – Mark

На самом деле мне пришло в голову, что я использую библиотеку FreImage для создания этих файлов из растрового изображения для создания файла jpg или png. Каковы шансы, что эти файлы уже помечены воедино с таким хэшированным идентификатором. – Mark

FreeImage Library – Mark

Я думаю, что MD5 стоит проверить. Конечно, это даст вам тот же результат, если контент будет тем же, но я думаю, вы можете увеличить его до тех пор, пока не получите уникальный.

источник

2010-04-30 18:31:41 m0s

Это то, что я хочу, чтобы это сделать - дать одно и то же имя для одного и того же контента. – Mark

Ну, тогда MD5 - это именно то, что вам нужно. Его не сложно найти исходный код, также я уверен, вы можете найти множество небольших инструментов командной строки, которые будут хешировать md5. – m0s

спросите, и вы получите - этот форум поражает (хотя мне нужно было что-то вроде хэширования). – Mark

имена файлов на основе содержимого файла

ответ

Смежные вопросы