Я ищу стратегии, которые можно было бы использовать для программного поиска файлов, которые может быть дубликатами друг друга. В частности, в этом случае видео.Стратегии сопоставления файлов
Я не ищу точные соответствия (так же хорошо, как это было бы в стране радуг и солнечного света). Я просто собираюсь собрать пару видео, содержание которых может быть таким же, чтобы человек мог сравнить их, чтобы подтвердить. Например, тот же контент, различное разрешение.
Стратегии у меня до сих пор:
- хеширования
- Сравнивая размер файла
- Сравнивая длину видео
- Сравнение имен файлов
- Держа выводы упорно «помнить» предыдущие дубликаты
- Стратегии смешивания и сопоставления выше
Существуют ли какие-либо стратегии или усовершенствования стратегий, перечисленных выше, о которых вы знаете?
Кто-нибудь знает какие-либо хэш-функции, которые производят диапазоны хэширования, чтобы указать, что общий контент «близок».
Если я скачал одно из видео, перекодировал его и перезагрузил в вашу систему, вы хотите, чтобы ваша система находила его в качестве возможного дубликата? –