2013-04-26 4 views

ответ

0

Я предполагаю, что вы собираетесь использовать php для этого, так что вы можете попробовать проверить некоторые библиотеки, например PHPWord by Microsoft.

0

Если вы хотите отображать только содержимое документа, это можно сделать с использованием некоторых языков сценариев, таких как php. В основном офисные форматы 2007+ - это сжатые XML-документы с измененным расширением. Сделайте простой документ Word + Word, сохраните его и измените расширение с .docx на .zip, чем вы можете извлечь его и посмотреть, из чего он сделан. Вы можете найти много деталей here. Теперь отображение содержимого может быть немного сложным. Как уже упоминалось, есть библиотеки для этого, но как они будут обрабатывать документы, я не уверен. Большинство из них заброшены, PHPword находится в стадии бета-тестирования с 2011 года.

Есть некоторые признаки того, что Apache работает над облачной версией Open office, но еще нет даты выхода. После этого у вас будет полнофункциональное веб-приложение для офисного пакета.

Если вы действительно изобретательны, вы можете использовать задание cron (или запланированную задачу, если вам нравится Windows), чтобы открыть документ, сделать снимок экрана и в основном сделать .jpg или .png версию документа (отлично работает с короткими документами, более длинные могут быть проблематичными), отображая их в браузере без особых осложнений. Также можно запланировать экспорт в .pdf - все браузеры имеют плагины Adobe PDF.

Подводя итог, использование php для анализа простых документов должно быть прекрасным, но получение сложных документов для правильного отображения может быть гораздо более сложной задачей и, возможно, не стоит вашего времени. Я бы пошел на экспорт cron в pdf, чтобы сохранить большинство, если не всю структуру документа.

Смежные вопросы