2010-07-22 2 views
2

Я знаю, что было несколько вопросов по этой теме.Получить простой текст из файла PDF

Мне нужен фреймворк/скрипт/решение для получить простой текст из файла PDF по php.

Существует ли решение, как получить простой текст из файла PDF?

(И да, я искал это время. Это последний шанс).

ответ

1

В системе Linux, просто используйте pdftotext (с shell_exec)

echo `pdftotext in.pdf out.txt`; 

PS: Посмотрите на эту article, я не знаю, если это полезно или нет.

+0

А как насчет commencial webhostings? Я не могу установить Linux-приложения на сервер. – Martin

+0

Если они не отключили функцию 'shell_exec' (и ее семейство), вы можете просто загрузить исполняемый файл и запустить его. – Ehsan

0

Я считаю, что вы можете что-то сработать, используя google docs API, который обрабатывает OCR.

Он преобразует изображение в виде открытого текста, так что вы сначала должны преобразовать PDF в изображение с GhostScript и ImageMagick или что-то еще

Смежные вопросы