Итак, некоторый алгоритм для генерации уникального, разумного имени файла длины на основе содержимого двоичного файла. Два файла с одним и тем же двоичным содержимым должны иметь одно и то же имя. Очевидно, что для этого были бы ограничения, поскольку, по-видимому, у вас не было бы уникальных имен наименьших размеров для каждого большого набора больших файлов, отличающихся только небольшим количеством бит. Но, по-видимому, существует некоторое эвристическое, наилучшее приближение к этому, которое, например, использует известные атрибуты типичных файлов изображений. Если бы у меня было имя какого-то алгоритма, который делает это, я могу google и найти другие подходы.имена файлов на основе содержимого файла
ответ
Использование файла MD5 hash содержимого файла.
Я думаю, что MD5 стоит проверить. Конечно, это даст вам тот же результат, если контент будет тем же, но я думаю, вы можете увеличить его до тех пор, пока не получите уникальный.
Это то, что я хочу, чтобы это сделать - дать одно и то же имя для одного и того же контента. – Mark
Ну, тогда MD5 - это именно то, что вам нужно. Его не сложно найти исходный код, также я уверен, вы можете найти множество небольших инструментов командной строки, которые будут хешировать md5. – m0s
спросите, и вы получите - этот форум поражает (хотя мне нужно было что-то вроде хэширования). – Mark
- 1. Переименование файлов на основе содержимого файлов txt
- 2. Создание файла Excel на основе содержимого папки
- 3. Сортировка лог-файлов на основе их содержимого
- 4. Имена папок на основе имен файлов
- 5. Сортировка содержимого файла на основе содержимого
- 6. Сортировка файлов на основе содержимого в Баш
- 7. поиск совпадающих файлов на основе содержимого
- 8. Python-фильтрация, хотя несколько файлов на основе содержимого другого файла
- 9. Переименование файлов на основе содержимого файла в UNIX
- 10. Подмножество корпуса на основе содержимого текстового файла
- 11. Vim autocmd на основе содержимого файла
- 12. mod_rewrite: Переименовать имена файлов на основе языка
- 13. массовое переименование файлов, переупорядочивающих имена файлов на основе разделителя
- 14. Выберите тысячи файлов на основе имени файла
- 15. Копирование файлов на основе условия имени файла
- 16. Regex Grab имена файлов на основе списка расширений файлов
- 17. Получить тип файла данного файла - на основе содержимого
- 18. Javafx: добавление содержимого на вкладки на основе выбранного файла
- 19. Разделение файла в linux на основе содержимого
- 20. Переименование файла Mule xml на основе содержимого
- 21. Создание массива объектов на основе содержимого файла
- 22. Печать содержимого файла на основе пользовательского ввода
- 23. Detect типа файла на основе содержимого
- 24. Обновление файла HTML на основе содержимого JSP-файла
- 25. Идентификация повторяющихся файлов на основе содержимого данных в SSIS
- 26. Powershell копирует файлы в другое место на основе содержимого файла
- 27. Сохраните нумерованные версии файлов excel на основе содержимого папки
- 28. Имена файлов папок и имена файлов
- 29. Переименование файла Html на основе содержимого из файла с помощью пакетного файла
- 30. Переименование файла на основе его содержимого с использованием пакетного файла
хеширование - право. Спасибо – Mark
На самом деле мне пришло в голову, что я использую библиотеку FreImage для создания этих файлов из растрового изображения для создания файла jpg или png. Каковы шансы, что эти файлы уже помечены воедино с таким хэшированным идентификатором. – Mark
FreeImage Library – Mark