Мы обрабатываем много входящих PDF-файлов, извлекая их страницы в отдельные файлы. И иногда мы сталкиваемся с этой странной проблемой. Каждая извлеченная страница будет почти размером всего файла. Например, если PDF составляет 500 Мбайт и имеет 1000 страниц, то извлечение из него отдельных страниц приведет к 1000 файлам по 500 мб. Хотя при открытии отдельных файлов страниц вы можете видеть только одну страницу.Как исправить этот странный искаженный pdf-выпуск
Когда мы используем функцию Adobe Acrobat Уменьшить размер файла, Adobe Acrobat занимает некоторое время и производит меньший файл. И после этого проблема извлечения страниц исправлена. Страницы начинают правильно извлекаться и имеют небольшие размеры.
До сих пор мы сталкивались с несколькими файлами и, вероятно, встретим больше.
Я попытался найти инструмент для автоматического восстановления таких файлов, и мы скачали и попробовали инструмент PODflib PLOP. К сожалению, он не исправил файл, хотя я выбрал все возможные варианты ремонта и оптимизации. Вот командная строка я использовал:
~/хлопнуть -v 4 --inputopt "xmppolicy = удалить ремонт = сила" --outputopt Оптимизировать = все --outfile fixed.pdf bad.pdf
Он не сделал устранить проблему вообще.
Вы когда-нибудь сталкивались с такими проблемами? И есть ли у вас пример того, как их исправить, используя библиотеку pdflib или любую другую библиотеку или инструмент?
Как это вопрос программирования? В лучшем случае это общий программный вопрос, который более подходит для [su]. В худшем случае это рекомендация по рекомендации инструмента, которая согласно [help/on-topic] специально не соответствует теме. –
Решение этой проблемы может быть в некоторой библиотеке, например pdflib. И это решение необходимо для автоматизации (а не для ручной работы). Лучшим ответом является ответ программирования. Вот почему он здесь, а не в SuperUser –
В вашем вопросе ничего не говорится о программировании, и мы не можем рекомендовать инструмент или библиотеку. Вам нужно перефразировать свой вопрос или перенести его на [su]. –