2014-09-03 1 views
0

Я установил diffutils-2.8.7-1.exe в системе Windows XP.Отчет GNU Diff Utility as Differ где Files is same

Я создал документ Word MS Office с некоторым текстом и изображением.

Сценарий 1:

Command: diff --report-identical-files "file1.doc" "file1.doc" 

Это дает результат, как "Одинаковые".

Action: Now i have copy pasted the file1.doc. 

Сценарий 2:

Command: diff --report-identical-files "file1.doc" "Copy of file1.doc" 

Это дает результат, как "Одинаковые".

Action: Now i have opened the file1.doc and Save As file2.doc 
     Without doing any modification in the content. 
     Visually both files look identical. 

Сценарий 3:

Command: diff --report-identical-files "file1.doc" "file2.doc" 

Это дает результат, как "Отличаются".

Query: Could anyone please explain how it can happen ?? 
     Is diff utility checks something beyond the content of the document ?? 

ответ

0

Причиной двух .doc файлов будет отличаться, даже если их содержание идентичны в том, что существуют дополнительные метаданные сохраняются в файле, и эти метаданные отличаются.

Если вы не используете более интеллектуальный инструмент сравнения, вам не повезло. diff вообще не понимает формат файла .doc и таким образом сравнивает каждый байт отдельно, неспособный игнорировать то, что вы считаете несущественным.

+0

Есть ли другой инструмент, который может работать как «diff», а также мы можем указать, какие данные следует учитывать и какие данные следует игнорировать? – user3603649

+0

Большинство инструментов сравнения со встроенным режимом «Сравнение слов» сделают это. Инструмент, для которого я работаю (ECMerge), использует для этого текстовый экстрактор. Вы можете использовать его визуально или из командной строки. – armel