2009-10-12 3 views
0

У нас есть куча документов в нашей организации, которые были непреднамеренно сохранены как Adobe PDF packages (также известные как коллекции PDF 1.7). Мы хотели бы преобразовать их в обычные PDF-файлы (большинство этих «пакетов» содержат один файл pdf pdf), но с учетом количества файлов это невозможно вручную.Программно извлечение файлов Adobe PDF

Любой эксперт Adobe знать ли:

  1. Существует с открытым исходным кодом или свободная библиотека, которая обрабатывает PDF формат пакета, который я могу написать сценарий вокруг?
  2. Имеет ли Adobe Pro 9 соответствующий скриптовый интерфейс, который позволит мне извлечь соответствующий файл из каждого пакета?

В качестве альтернативы, я рассматриваю подход на основе макросов, но я бы предпочел не идти по этому маршруту, пока не исследую другие варианты.

Спасибо!

ответ

3

После кучи копания, я нашел pdftk, который распространяется как источник и двоичный файл на многих платформах.

Он выполняет почти все то, что нам нужно сделать, и теперь мы можем перебирать наши документы и рекурсивно вызывать pdftk на каждом (некоторые из них - многоуровневые цепочки привязок).

1

Примечание. Pdftk будет разбивать страницы видимого документа только на отдельные документы. Скрытые документы остаются скрытыми.

Опция, которую вы должны использовать, - unpack_files.

Еще один нежелательный формат обфускации, который препятствует интероперабельности, поэтому классифицируется как вредоносное ПО.

1

Использование Adobe Acrobat Professional объединить все в один PDF, а затем разделить на уровне закладки

+0

Программным? Не вручную? – nhahtdh

1

Я понимаю, эта нить несколько лет, но если кто-то ищут бесплатную утилиту для извлечения файлов из PDF-пакетов (особенно из больших коллекций), затем проверьте бесплатную утилиту ByteScout PDF Multitool: она была протестирована с файлами пакетов 500+ MB, чтобы извлечь сотни многоуровневых прикованных вложений.

Отказ от ответственности: Я связан с ByteScout

Смежные вопросы