У меня есть два файла CSV, и мне нужно проверить создание, обновления и удаления. Возьмите следующие примеры файлов:Сравнение CSV-файлов в ubuntu
ORIGINAL FILE
sku1,A
sku2,B
sku3,C
sku4,D
sku5,E
sku6,F
sku7,G
sku8,H
sku9,I
sku10,J
UPDATED FILE
sku1,A
sku2,B-UPDATED
sku3,C
sku5,E
sku6,F
sku7,G-UPDATED
sku11, CREATED
sku8,H
sku9,I
sku4,D-UPDATED
Я использую команду Линукс комм следующим образом:
comm -23 --nocheck-order updated_file.csv original_file > diff_file.csv
Который дает мне все вновь создаваемые и модифицируемые строки следующим образом
sku2,B-UPDATED
sku7,G-UPDATED
sku11, CREATED
sku4,D-UPDATED
Который является отлично, но если вы посмотрите внимательно, «sku10, J» был удален, и я не уверен, что это лучшая команда/способ проверить его. Данные, которые я предоставил, представляют собой просто демоверсию, текст «sku» не существует в реальных данных, однако столбец один из CSV-файлов является уникальным индексом 5 символов. Любые советы приветствуются.
Привет @prime, то, что вы ищете, должно быть здесь -> https://www.google.fr/search?q=compare+two+files+with+bash&ie=utf-8&oe=utf-8&gws_rd=cr&ei = j22OVuzKIcOuPqaRougF –