Самый быстрый способ найти различия между двумя файлами в unix?

Я хочу найти разницу между двумя файлами, а затем поставить только различия в третьем файле. Я видел разные подходы, используя awk, diff и comm. Есть ли еще?Самый быстрый способ найти различия между двумя файлами в unix?

например. Compare two files line by line and generate the difference in another file

например. Copy differences between two files in unix

Мне нужно знать, что самый быстрый способ найти все различия и перечисления их в файле для каждого из приведенных ниже случаев -

Case 1 - file2 = file1 + extra text appended. 
Case 2 - file2 and file1 are different.

источник

2013-08-05 Steam

, так как это зависит от ваших ресурсов, то Лучше всего настало время самому себе – perreal

не могли бы вы сделать ваши дела более конкретными и, возможно, дать пример кода, который вы пробовали? – asf107

Для случая 2 существует 'cmp', который сравнивает два байта по байтам. – micke

Вы можете попробовать ..

comm -13 <(sort file1) <(sort file2) > file3

или

grep -Fxvf file1 file2 > file3

или

diff file1 file2 | grep "<" | sed 's/^<//g' > file3

или

join -v 2 <(sort file1) <(sort file2) > file3

источник

2013-08-05 23:54:17 danmc

Да, но какой из них был бы самым быстрым? – Steam

Используя два больших текстовых файла, где у вас есть дополнительный абзац текста в начале, я приурочил все четыре метода. Методы grep, diff и join не смогли найти дополнительный абзац. Методам diff необходимо использовать grep «>» в дополнение к «<» для работы. Я не знаком с методами grep или join. Результаты: comm: 3.661s, grep: 0.035s, diff: 0.051s, join: 3.811s –

@JasonHartley Получите помощника по жизни, есть только так много способов, которыми эти команды могли быть написаны. Кроме того, ответ, который вы избегаете, имеет одну команду, в которой я предоставил несколько. – danmc

Вы могли бы также попытаться включить md5-хеш-суммы или аналогичные действительно определяют, есть ли какие-либо различия на всех. Тогда, только сравнивать файлы, которые имеют разные хэши ...

источник

2013-08-07 13:01:23

как я могу это сделать? – Steam

Но хеширует два файла быстрее, чем сравнение двух файлов? –

Другой вариант:

sort file1 file2 | uniq -u > file3

Если вы хотите видеть только дублированные записи используйте "уник -d" вариант:

sort file1 file2 | uniq -d > file3

источник

2014-04-29 15:37:33 pron

Это будет работать быстро:

Case 1 - File2 = File1 + добавленный дополнительный текст.

Grep -Fxvf file2.txt FILE1.TXT >> file3.txt

Файл 1: 80 Линии Файл 2: 100 линий Файл 3: 20 Линии

источник

2015-04-17 08:58:08

Самый быстрый способ найти различия между двумя файлами в unix?

ответ

Смежные вопросы