2016-06-24 2 views
1

У меня есть 1000 файлов PDF с несколькими страницами, и каждый PDF имеет разное разрешение (на основе сканеров, используемых для их сканирования). Я хочу преобразовать каждую страницу PDF в PNG, чтобы передать ее Tesseract для OCR. Я использовал Imagemagick для преобразования в PNG, но мне нужно передать фиксированный DPI для всех изображений, чтобы получить хороший читаемый вывод. Есть ли способ конвертировать каждый PDF, сохраняя разрешение этого PDF тоже?Преобразование PDF в PNG с одинаковым разрешением - Imagemagick

Например, если 1.PDF имеет разрешение 622 × 788 и 2.pdf имеет разрешение 792 × 612, я хочу, чтобы точное преобразование с одинаковым resoultion было в другом формате (PNG).

Команда Я использую прямо сейчас:

convert -monochrome -density 1200 input.pdf -resize 25% -monochrome -white-threshold 50% -black-threshold -50% output.png 

Спасибо, pashah

+1

, пожалуйста, добавьте команду, которую вы используете для преобразования. только таким образом можно получить ответ, который на самом деле объясняет что-то – rll

+0

извините .. обновил сообщение командой – pashah

ответ

0

Возможно прочитать геометрию первой страницы, а затем изменить размер всех страниц, чтобы соответствовать?

SIZE=$(identify -format '%g' input.pdf) 
convert -monochrome \ 
     -density 1200 \ 
     -resize $SIZE \ 
     -white-threshold 50% \ 
     -black-threshold -50% \ 
     -append \ 
     output.png 
+0

Спасибо @emcconville. Однако это не сохраняет разрешение. Выходное изображение png ухудшается. – pashah

Смежные вопросы