Текстовый экстрактор zachron/pdfiphone (предположим, вы имели в виду, что один) является чрезвычайно наивным и делает очень много предположений.
Он игнорирует структуру файла PDF и, следовательно, полностью игнорирует, проверяются ли данные, которые он проверяет, в текущей версии.
Он игнорирует шифрование и, следовательно, полностью не работает для многих документов с ограничениями использования.
Он полностью игнорирует кодировки шрифтов и неявно принимает ASCII'ish - это довольно часто верно в небольших PDF-файлах только с английским текстом, а не с встроенными шрифтами; иначе результат может быть любым.
... много еще много предположений ...
Если один только не приходится иметь дело с очень простыми документами и извлеченный текст не является действительно необходимым для функциональности своего кода, я хотел бы предложить используя другой код для извлечения текста.