2015-08-26 4 views
-1

Я пытаюсь сравнить и объединить 2 pdf-файла с текстом, рисунками и бликами/комментариями.Сравните файлы PDF визуально (рисунки и основные моменты) и объедините различия

Старый файл будет иметь подсветки и комментарии, но новый файл будет иметь изменения в тексте и чертеже без подсветки или комментариев, мне нужно иметь возможность сравнить все различия и объединить основные моменты и комментарии из старого файла обратно в новый файл, где это применимо.

До сих пор я нашел несколько инструментов, которые выполняют сравнение, но не слияние/блики. Я тестировал DiffPDF, и он работает для сравнения, но я не уверен, как я могу использовать это для слияния файлов. Любое программное обеспечение/инструмент, который делает это уже и есть способ сделать слияние с diffpdf?

ответ

2

Нет простого способа сделать то, что вы просите. Даже если вы идете на низкий уровень, перед вами стоят большие проблемы. PDF сильно отличается от других форматов документов тем, что в документе нет семантической структуры, поэтому было бы очень сложно, чтобы что-то вроде процесса слияния могло выяснить, что делать. Возможно, вам придется попробовать совершенно другой подход. Помните, что PDF был разработан, по существу, для точного отображения на разных платформах. Он никогда не был предназначен для редактирования документов.

+0

Thanks for the reply! Я понимаю, что это непростая задача, но я надеялся, что есть способ объединить по крайней мере основные документы, такие как «Основные моменты из PDF A» и переместить их в PDF B, а затем пользователь может вручную проверить изменения. И вы говорили о другом подходе, о каких-то идеях? – scc

+0

Если вы хотите перейти на низкоуровневый уровень, аннотации находятся в словаре, который отличается от так называемого потока контента, поэтому вы можете скопировать целевой PDF и добавить словарь аннотаций из источника. Тем не менее, аннотации задаются исключительно геометрически, поэтому это будет работать только в том случае, если текст не изменяется. В зависимости от вашей платформы есть API-интерфейсы для получения содержимого словарей документа PDF. Это не тривиально, но опытный программист должен иметь возможность копировать аннотации без особых трудностей. –

Смежные вопросы