2013-11-15 3 views
11

с php мне нужно разделить один файл PDF с несколькими страницами внутри него на много файлов PDF с одной страницей на файл. Я использую pdftk и отлично работает, но каждый PDF, созданный для каждой страницы, очень большой. Мой оригинальный PDF - 7 МБ (с 70страницами внутри), сумма каждого файла, созданного путем разделения с pdftk, превышает 70 МБ.pdftk split pdf с несколькими страницами

Кто-нибудь знает, есть ли свойство, чтобы установить для pdftk небольшой выход на файл?

спасибо

+0

Очень хорошее решение заключается в использовании cloudinary для разделения и извлечения Pdf просмотра как изображения .. http://cloudinary.com –

ответ

18

Вы всегда можете указать compress вариант - например:

pdftk input.pdf burst output output_%02d.pdf compress 

Обратите внимание, что pdftk просто копирует содержание ваших PDF файлов из входов в выходы, и не может сделать очень много, чтобы оптимизировать раздувание. Поэтому, если ваши входные PDF-файлы большие/сложные, ваши выходные PDF-файлы также будут. Также обратите внимание, что любые шрифты, встроенные в документ, могут быть дублированы в каждом документе вывода, занимая больше места.

+0

я стараюсь он, но не работает :(У меня одинаковый размер файла –

+0

@Simone, как сказал pobrelkey, у вас могут быть общие ресурсы в оригинальном файле, например, шрифты или фоновое изображение, которые теперь дублируются в два раза. Возможно, одна страница образец поможет кому-то предложить способы оптимизации.И обратите внимание: 'pdftk' не сжимается до максимума (с использованием 1,5 таких функций, как сжатый столбец xref и потоки объектов, думал, что он не даст 70-кратного сжатия, конечно) – user2846289

+2

ОК, я пытаюсь с этим и решил свою проблему : http://pandemoniumillusion.wordpress.com/2008/05/07/compress-a-pdf-with-pdftk/ –

5

При разбиении файлов PDF иногда бывает трудно избежать информации, которая требуется только для некоторых страниц, включенных в каждый выходной файл.

cpdf пытается избежать этого - вы можете попробовать и посмотреть, что произойдет. Вы можете обнаружить, что это не лучше, чем pdftk в вашем файле, но это должно быть.

Раскрытие информации: Я являюсь автором cpdf.

7

Вы можете использовать pdftk и попробовать

pdftk source.pdf cat 1-100 output try1.pdf 
pdftk source.pdf cat 101-end output try2.pdf 
1

была аналогичная проблема. Но не применяется 1: 1 к вопросу. В любом случае кто-то может оказаться полезным:

  1. У меня был очень большой PDF-файл - original.pdf - более 240 МБ. Это было почти невозможно использовать. Я распечатал его с evince как pdf, а удалил любое масштабирование в настройках принтера. Это сгенерировало файл - new.pdf - от около 102MB! Очевидно, все встроенные шрифты, закладки и т. Д. были удалены.
  2. Для того чтобы получить закладки для работы назад, я использовал cpdf, чтобы извлечь закладки из оригинального pdf-документа и применить его к новым. Итоговый документ - result.pdf - легко перемещаться и очень быстро в любой просмотрщик PDF.

Ссылка: CPDF для извлечения и применять закладки: http://www.coherentpdf.com/cpdfmanual/node38.html

cpdf -list-bookmarks original.pdf > booksmarks.txt 
cpdf -add-bookmarks booksmarks.txt new.pdf -o result.pdf 
Смежные вопросы