2009-08-13 2 views
1

Мне было интересно, существует ли способ для php, чтобы проверить, поврежден ли файл PDF, хранящийся локально на сервере, или нет. У нас есть приложение php, которое имеет дело с большим количеством отсканированных документов, преобразованных в PDF, и было бы неплохо проверить, какие из них повреждены, чтобы предупредить пользователя. Я попытался оглянуться, но не повезло.Проверьте, поврежден ли файл PDF с помощью PHP

ответ

1

Имеются версии pdflib, которые могут читать PDF-файлы - вы могли бы просто попытаться открыть и прочитать каждую страницу с этим.

+0

Спасибо за ответ, я смотрел, может ли быть чисто php-решение без приложений третьей части. Кстати, я дам ему взгляд – 2009-08-13 08:59:01

+0

Это не приложение для третьей части ... PDF-библиотека pCOS, по крайней мере, доступна как расширение PHP. Я использовал pCOS для анализа PDF-файлов (проверка изображений, встроенных шрифтов и т. Д.). Я не уверен, что это будет похоже на обнаружение «коррупции», но вы можете определенно проверить это бесплатно. – Narcissus

0

Проблема заключается в том, что файл PDF может быть поврежден.

Возможно, вашим лучшим решением было бы найти PDF-чтение lib и попытаться извлечь первое слово с каждой страницы или что-то в этом роде. Это, по крайней мере, поймало бы некоторые основные виды коррупции.

Смежные вопросы