2010-03-08 5 views

ответ

3

Google pdf2html, pdftohtml выглядит единственно жизнеспособным. и он основан на командной строке, а не на PHP. так что это может быть вам не полезно. Google способен конвертировать, поэтому может быть и способ сделать это с помощью GDocs. хотя я не уверен в этом. Во всяком случае, я надеюсь, что это приведет вас к правильному пути, по крайней мере.

+0

Я не знаю php, но, предположительно, вы можете выполнить/вызвать скрипт оболочки из php (и захватить вывод), так что, вероятно, это будет работать –

+0

Абсолютно вы можете это сделать, поэтому я его поднял, Не уверен, что Google позволит ему легко делать то, что он хочет. –

+0

отличное решение, спасибо! –

0

Вы не можете.

PDF-файлы - это сложные документы, содержащие встроенные шрифты, векторную графику и информацию о макете, которые не могут быть представлены в HTML автоматическим способом. Вы можете извлечь ТЕКСТ документа, но об этом.

1

Я пробовал команду pdftohtml Poppler для преобразования файлов PDF в файлы HTML. Check it out on Выход HTML-файла из Poppler легче, но его вывод не очень точен.

Если вы хотите точный вывод, вы должны use pdf2htmlEX Я конвертировал сложные PDF-файлы и получил лучший выход HTML.

Смежные вопросы