2014-09-07 5 views
0

Я пытаюсь преобразовать первую страницу PDF (содержащую изображение и текст) в изображение с помощью Wand (привязка Imagemagick для python). Результат выглядит так! http://i.stack.imgur.com/OdCMZ.jpg Текст здесь не является частью изображения. Изображение не охватывает полностью. Это видно только на одну половину.Преобразование PDF в изображение: проблема с интервалом

Если PDF не имеет никакого текста, он охватывает полностью, как это .. http://i.stack.imgur.com/NmcjO.jpg Текст это часть изображения

Я не понимаю, если проблема с текстом или библиотеке , Как первый образ также полностью охватывает.

ответ

0

при преобразовании pdf, imagemagick с использованием Ghostscript. если вы хотите результат только иметь внутренняя границаbox содержание. вы можете использовать опцию '-dUseCropBox'.

import subprocess 
cmd = [ 
    'gs', 
    '-q', 
    '-dQUIET', 
    '-dSAFER', 
    '-dBATCH', 
    '-dNOPAUSE', 
    '-dNOPROMPT', 
    '-dMaxBitmap=500000000', 
    '-dAlignToPixels=0', 
    '-dGridFitTT=2', 
    '-dUseCropBox', 
    '-dTextAlphaBits=4', 
    '-dGraphicsAlphaBits=4', 
    '-r{0}x{0}'.format(200), 
    '-sDEVICE=jpeg', 
    '-dJPEGQ=100', 
    '-sOutputFile=%05d.jpg', 
    'test.pdf' 
] 
subprocess.call(cmd)