Я пытаюсь использовать fdupes в Mac OSX для удаления дубликатов текстовых файлов из каталога. Он уже удалил кучу дубликатов.Как удалить имя файла из верхней части некоторых текстовых файлов
Проблема, с которой я столкнулся сейчас, заключается в том, что среди оставшихся много дубликатов, за исключением того, что в одном из файлов имя файла является первой строкой, за которой следует пустая строка, за которой следует текст.
Итак, я хотел бы найти все файлы, у которых есть имя файла, повторяющееся вверху, а затем разделите эту и следующую пустую строку так, чтобы fdupes распознавали их как дубликаты. Это позволит мне использовать fdupes для их анализа.
Пример:
file001.txt:
test 123
test
file002.001.txt:
file002.001.txt
test 123
test
Какой самый лучший способ пойти по этому поводу?
Я не эксперт в этой области, но я полагаю, вы могли бы достичь своей цели проще с помощью инструментов командной строки, таких как 'sed',' diff' и т. Д. – ArtM