2009-09-05 4 views
-4

в моем PHP скрипт я хочу, чтобы преобразовать PDF-файл в формате HTML и при этом это сгенерированные содержимое файла HTML не должен быть нарушен ....PDF в HTML преобразования в PHP

я нашел http://sourceforge.net/projects/pdftohtml/ но это инструмент командной строки и нужен доступ к оболочке. Во-вторых, генерируется содержимое html-файла.

+2

Вы уже задали тот же вопрос: http://stackoverflow.com/questions/1383176/pdf-to-html-conversion -in-php – AAA

+0

Не совсем такой же вопрос, если вы смотрите за пределы названия, но все же очень запутываетесь. – pavium

+0

эй Джейми Льюис, пожалуйста, прочитайте оба вопроса снова, оба разные. –

ответ

1

Можно ли выполнить команду оболочки из php?

$rtn = exec ('CLI Command to execute', $emptyVartoCaptureOutput); 

Команда выполняется в оболочке, выполняется в контексте пользователя, запустившего сценарий PHP (_WWW или аналогичных скриптов работают с веб-сервера) апача. Все выходные данные команды захватываются в массив при поставке второго необязательного аргумента.

Похоже, что это может решить вашу проблему.

В ответ на ваш комментарий:

Инструмента вы ссылаетесь на исходном сообщении является инструментом командной строки, вы должны выполнить - вы должны выяснить точную команду для выполнения включая любые аргументы для этой команды.

Я не знаком с инструментом, с которым вы ссылаетесь, но я подозреваю, что он имеет различные варианты. Несколько важных вариантов, на которые следует обратить внимание, это то, где сгенерированный html идет. Я бы предположил, что это может пойти либо в файл (для чего нужно, чтобы _WWW имел права на запись в каталог, который представляет собой огромный риск для безопасности) или для вывода на печать. Когда вы используете команду exec из php, любой вывод, отправленный в std out, сохраняется как массив, новый элемент для каждой новой строки, когда вы передаете функцию exec необязательный второй параметр. Таким образом, вы сможете улавливать и манипулировать и/или отображать выводимый html динамически из вашего скрипта.

Для простой HTML-страницы, только отображает HTML из PDF, вы можете сделать что-то вроде этого:

<std header stuff omitted for brevity> 
<?php 
$rtn = exec('CLI Command to Execute -a option1 -b option2', $ouputted_html); 
foreach ($ouputted_html as $val){ 
    echo $val . "\n"; 
} 
?> 
</body> 
</html> 

Вы можете использовать эхо взрывать ("\ п", $ outputted_html); вместо цикла foreach, чтобы выполнить то же самое, но цикл foreach позволяет вам контролировать некоторые строки, если вы решите воспользоваться им.

Обратите внимание, что сгенерированный html может содержать или не содержать информацию заголовка, вам придется экспериментировать и видеть. Очевидно, вы можете добавить то, что требуется или вычитает стандартная html-страница, если она уже предоставлена.

Итак, теперь у вас есть основание для отображения файлов PDF в виде html, если вам нужна конкретная помощь в тонкостях этого инструмента, я предлагаю вам найти форум или список рассылки, посвященный этому инструменту, или, возможно, обратиться за помощью к разработчику (ы) после прочтения документов и часто задаваемых вопросов.

+0

Скотт, может предложить любое приложение командной строки ..Заранее спасибо –

+0

Вы можете подумать о ответах, которые вы найдете полезными, даже если они не полностью отвечают на ваш вопрос. Я отредактирую свой оригинальный ответ, чтобы ответить на ваш комментарий. – Scott

+0

+1 хороший ответ – jycr753

0

Ваш лучший выбор - найти конвертер PDF в формате PDF с открытым исходным кодом и изучить исходный код.

Существует множество онлайн-конвертеров вокруг, примерно. Google предлагает преобразовать любой файл PDF, который он находит в поиске, и называет его «просмотром как HTML»

Смежные вопросы