2012-03-28 2 views

ответ

14

не изображений только, как вам кажется, нужно, но

  • pdftocairo

http://poppler.freedesktop.org/

http://www.manpagez.com/man/1/pdftocairo/(страница руководства)

способен отобразить страницу в формате PDF в другие векторные форматы, такие как PS/EPS/SVG

если у вас есть страница в формате PDF с векторизованных изображений, вы можете сделать эту страницу в SVG, а затем скопировать только изображение вы заинтересованы в

Примечание: pdftocairo не может сделать многостраничный PDF в многостраничный SVG

, если вам нужно преобразовать в SVG несколько Pdf страниц, нужно сначала выбрать этот диапазон страниц, а затем лопнуть Pdf страниц на отдельные страницы в формате PDF

пример (если нам нужно преобразовать страницы 1-10 из файла в формате PDF для SVG)

  • 1 °

pdftk file.pdf cat 1-10 output 1-10.pdf

  • 2 °

pdftk 1-10.pdf burst

  • 3 °

for f in *.pdf; do pdftocairo -svg $f; done

  • 4 °

наконец, с Sodipodi или Inkscape, вы можете извлекать изображения вы заинтересованы в SVG визуализации PDF Страница

+0

Спасибо за комментарии! , из того, что я прочитал, мне кажется, что все эти методы потребуют вмешательства человека. То, что я искал, - это инструмент, который принимает файл в формате pdf, и возвращает все фигуры, содержащиеся в нем. Точно так же, как и pdfimages, с исключение, что векторные изображения возвращаются как векторные изображения, а не как растровые изображения. – v923z

2

This article описывает инструменты gpdfx, inkscape и pdf2s vg, которые не полностью основаны на командной строке, но все же полезны.

3

Что вы считаете «фигурой»? Это концепция, которая не существует в PDF. Причина в том, что существует так много инструментов, которые могут извлекать изображения из PDF-файла, потому что изображения являются очень четко идентифицированными объектами.

Однако ваши «фигуры» гораздо менее четко определены. Файлы PDF могут содержать много векторного содержимого, которое вы бы не назовете цифрой.Например, текст можно погладить, что сделало бы его векторным искусством и, как таковое, его можно было бы спутать с вашими цифрами. Другие декоративные элементы могут использоваться на фоне страниц. Текст может быть подчеркнутым, который будет представлять собой векторный элемент ...

В другом направлении ваша «фигура» может содержать заголовок, который является текстом, что еще более усложняет ситуацию.

Поскольку PDF не имеет понятия фигуры, вам нужно выяснить, как изолировать его на странице PDF (возможно, потому, что приложение-создатель всегда добавляет к ним метаданные или потому, что использует специальный цвет или ... Если вы можете их изолировать, должно быть возможно обрезать все, что не важно на странице, и экспортировать то, что вам нужно, в качестве EPS или SVG, используя некоторые из методов, описанных в другом ответе.

Смежные вопросы