Между тем последние выпуски Ghostscript имеют гораздо более удобный и простой в использовании способ удаления всех изображений из PDF. Параметр для добавления в командной строке -dFILTERIMAGE
gs -o noimages.pdf -sDEVICE=pdfwrite -dFILTERIMAGE input.pdf
Даже лучше, вы также можете удалить весь текст или все векторный рисунок элементы из PDF путем указания -dFILTERTEXT
или -dFILTERVECTOR
.
Конечно, вы можете комбинировать любую комбинацию этих -dFILTER*
параметров, которые вы хотите, для достижения требуемого результата. (Объединение всех трех воли результата, конечно, в «пустых» страниц.)
Вот скриншот из примера страницы PDF, который содержит все 3 типа содержания упомянутых выше:
Скриншот оригинала PDF-страница, содержащая элементы «изображения», «вектор» и «текст».
Запуск следующие 6 команд будет создавать все 6 возможных вариаций остальных содержания:
gs -o noIMG.pdf -sDEVICE=pdfwrite -dFILTERIMAGE input.pdf
gs -o noTXT.pdf -sDEVICE=pdfwrite -dFILTERTEXT input.pdf
gs -o noVCT.pdf -sDEVICE=pdfwrite -dFILTERVECTOR input.pdf
gs -o onlyTXT.pdf -sDEVICE=pdfwrite -dFILTERVECTOR -dFILTERIMAGE input.pdf
gs -o onlyIMG.pdf -sDEVICE=pdfwrite -dFILTERVECTOR -dFILTERTEXT input.pdf
gs -o onlyVCT.pdf -sDEVICE=pdfwrite -dFILTERIMAGE -dFILTERTEXT input.pdf
На следующем рисунке показаны результаты:
Вверх строка, слева: весь «текст» удален; все «изображения» удалены; все «векторы» удалены. Нижняя строка, Слева: сохранен только «текст»; сохранены только «изображения»; только «векторы» сохранены.
Так кто-The-ад, что он лучше downvoted этот вопрос? По какой причине?!? Не стесняйтесь, но, пожалуйста, дайте комментарий и скажите мне, почему? –