У меня есть файловая структура, которая выглядит примерно следующим образом:Как я могу найти и удалить дубликаты и сохранить новейшие?
dir1
|--subdir1
|--file1 (modified date1)
|--file2 (modified date2)
|--file3 (modified date1)
|--subdir2
|--file4 (modified date3)
|--file5 (modified date4)
|--file6 (modified date3)
файлы являются музыкальные файлы с немного другой информации ID3, так fdupes не улавливает их как дублирующие, хотя они есть. Я хотел бы запустить команду из dir1
, которая будет перезаписываться в каждом подкаталоге, найти максимальную модифицированную дату для всех файлов и затем вызывать удаление любого файла с модифицированной датой, более старой.
Есть ли способ сделать это в Linux? Ожидаемый результат будет:
dir1
|--subdir1
|--file1 (modified date1)
|--file3 (modified date1)
|--subdir2
|--file4 (modified date3)
|--file6 (modified date3)
Если файлы не точные дубликаты, как мы знаем, один является дубликатом другого? Без этой информации ваш «ожидаемый» результат просто неожиданен. – tripleee
Я знаю, что они дубликаты, потому что файлы были первоначально организованы художником и альбомом ID3. Причина в дублировании заключается в том, что я повторно разорвал альбомы, используя немного отличную информацию о треке ID3. У меня нет возможности программно проверять фактические дубликаты, но я неявно знаю, что они есть. – wesanyer