Я пытался работать с pdftk для проверки информации из сжатых потоков PDF, созданных Nitro Reader, но pdftk не будет дефлировать потоки. Он не производит ошибок, но, похоже, ничего не делает, кроме переупорядочения PDF-объектов. Here - это минимальный пример одного из этих pdf-файлов.pdftk не будет распаковывать потоки данных
pdftk test.pdf output test-d.pdf uncompress
Когда я пытаюсь использовать pdftk для других PDF-файлов, это работает нормально. Если я вручную извлечу потоки данных и распакую их с помощью zlib в Python, они будут распаковываться правильно. Кроме того, если я открою PDF-документ в Adobe Reader и перезаряжаю, pdftk отлично работает с полученным pdf-файлом.
Я вручную изучил PDF-файл Nitro, и, похоже, это действительный pdf-файл. Я очень смущен тем, что здесь происходит.
В качестве фона для проблемы у меня есть сотни этих PDF-файлов, и я пытаюсь найти определенные ключевые слова, которые я должен был бы сделать, если бы я мог автоматизировать декомпрессию.
Pdftk версия 1,45
Windows 7 Home Premium SP1
Nitro Reader 2 версии 2.5.0.36
Спасибо, Джеймс