Требование, чтобы сравнить два огромных файлов Unix и писать разницу в третий файл, основанный на уникальном ключе (первое поле) после поиска несколько вариантов получили следующую команду:Сравнение двух больших файлов в Unix
awk 'FNR==NR{a[$0];next}!($0 in a)' hosts.csv masterlist.csv>results.csv
Хотя это дает различия, если для поля один файл содержит NULL (как слово) и другое пустое/пространство для нулевых значений, как игнорировать это в команде и сравнивать другие поля?
Также хотел бы сделать общий сценарий или утилиту с такими параметрами, не нуждаться в коде, но только предложение было бы полезно.
Является 'diff' не вариант? –
Пожалуйста, напишите [mcve], иначе это слишком абстрактно, чтобы знать, что вы ищете. – fedorqui
@commuSoft: попробовал с sdiff -W ... Но нужно также игнорировать Null .. Так что проверял, есть ли у нас лучший метод. – Vinod