У меня есть 100 файлов .txt с ~ 1 млн строк.Удалите повторяющиеся строки из нескольких текстовых файлов
Есть ли способ открыть все файлы, удалить дубликаты и сохранить строки в соответствии с каждым файлом (php/unix и т. Д.)?
Например:
file1.txt содержание
Something here1
Something here2
содержание file2.txt
Something here2
Something here3
После удаления:
FILE1.TXT содержание
Something here1
Something here2
содержание file2.txt
Something here 3
У меня было два разных ответа на первый, то я был немного ближе на ваш вопрос. Это сложнее, чем я думал. Для других потенциальных ответчиков обратите внимание, что OP хочет удалить строки из одного файла, если они существуют в любом другом файле. Это другое, чем просто удаление всех повторяющихся строк в каждом файле. – brianmearns
Выполняет ли порядок строк в каждом файле, когда вы закончите? Если нет, команда 'sort -u' может быть полезна, но она не делает прямо то, что вы ищете. Это может быть отправной точкой, хотя для кого-то умнее меня. – brianmearns
Да, я уже сортирую -u их, теперь мне нужно также удалить дубликаты из других файлов. –