Есть ли инструмент командной строки в linux, который будет извлекать цифры из файла pdf и сохранять их в векторном формате? Я знаю о pdfimages, но это создаст растровое изображение, и это не то, что мне нужно.извлечь векторное изображение из pdf-файла
ответ
не изображений только, как вам кажется, нужно, но
- pdftocairo
http://poppler.freedesktop.org/
http://www.manpagez.com/man/1/pdftocairo/(страница руководства)
способен отобразить страницу в формате PDF в другие векторные форматы, такие как PS/EPS/SVG
если у вас есть страница в формате PDF с векторизованных изображений, вы можете сделать эту страницу в SVG, а затем скопировать только изображение вы заинтересованы в
Примечание: pdftocairo не может сделать многостраничный PDF в многостраничный SVG
, если вам нужно преобразовать в SVG несколько Pdf страниц, нужно сначала выбрать этот диапазон страниц, а затем лопнуть Pdf страниц на отдельные страницы в формате PDF
пример (если нам нужно преобразовать страницы 1-10 из файла в формате PDF для SVG)
- 1 °
pdftk file.pdf cat 1-10 output 1-10.pdf
- 2 °
pdftk 1-10.pdf burst
- 3 °
for f in *.pdf; do pdftocairo -svg $f; done
- 4 °
наконец, с Sodipodi или Inkscape, вы можете извлекать изображения вы заинтересованы в SVG визуализации PDF Страница
This article описывает инструменты gpdfx, inkscape и pdf2s vg, которые не полностью основаны на командной строке, но все же полезны.
Что вы считаете «фигурой»? Это концепция, которая не существует в PDF. Причина в том, что существует так много инструментов, которые могут извлекать изображения из PDF-файла, потому что изображения являются очень четко идентифицированными объектами.
Однако ваши «фигуры» гораздо менее четко определены. Файлы PDF могут содержать много векторного содержимого, которое вы бы не назовете цифрой.Например, текст можно погладить, что сделало бы его векторным искусством и, как таковое, его можно было бы спутать с вашими цифрами. Другие декоративные элементы могут использоваться на фоне страниц. Текст может быть подчеркнутым, который будет представлять собой векторный элемент ...
В другом направлении ваша «фигура» может содержать заголовок, который является текстом, что еще более усложняет ситуацию.
Поскольку PDF не имеет понятия фигуры, вам нужно выяснить, как изолировать его на странице PDF (возможно, потому, что приложение-создатель всегда добавляет к ним метаданные или потому, что использует специальный цвет или ... Если вы можете их изолировать, должно быть возможно обрезать все, что не важно на странице, и экспортировать то, что вам нужно, в качестве EPS или SVG, используя некоторые из методов, описанных в другом ответе.
- 1. Векторное изображение квадратной сетки
- 2. Конвертировать pdf в векторное изображение
- 3. Извлечь изображение из NSData
- 4. Извлечь изображение из Docx
- 5. Извлечь изображение из содержимого
- 6. Изображение Градиентное векторное поле в Python
- 7. KD-Trees and missing values (векторное изображение)
- 8. Векторное изображение как многоразовый фрагмент XAML
- 9. Быстрое строковое векторное изображение В алфавитном порядке
- 10. Как мы можем нарисовать векторное изображение?
- 11. Сохранить пользовательский контроль WPF как векторное изображение
- 12. Как извлечь изображение из url
- 13. Извлечь изображение из ресурсов программы
- 14. Извлечь изображение ссылки из Википедии
- 15. Извлечь растровое изображение из PostScript
- 16. Как извлечь изображение из ресурсов?
- 17. Извлечь растровое изображение из TOleContainer?
- 18. Извлечь постерное изображение из видео
- 19. Python: Извлечь изображение из MSSQL
- 20. Извлечь изображение из BitmapCache WinRT
- 21. Извлечь изображение из MMS - Android
- 22. Извлечь изображение из Oracle DB
- 23. Извлечь растровое изображение из uri
- 24. javascript - добавить изображение в векторное изображение по URL-адресу?
- 25. Как задать векторное однострочное векторное задание?
- 26. Как распечатать SVG-файл с C#, чтобы получить не растровое изображение, а векторное изображение на распечатке?
- 27. Векторное образование
- 28. Как написать сложное CGPath или векторное изображение на диск?
- 29. Векторный клипарт: векторное изображение SVG для фигур Three.js?
- 30. Извлечь изображение из HTML в PHP
Спасибо за комментарии! , из того, что я прочитал, мне кажется, что все эти методы потребуют вмешательства человека. То, что я искал, - это инструмент, который принимает файл в формате pdf, и возвращает все фигуры, содержащиеся в нем. Точно так же, как и pdfimages, с исключение, что векторные изображения возвращаются как векторные изображения, а не как растровые изображения. – v923z