2016-10-14 6 views
1

Я узнал, что файлы .docx - это в основном двоичные файлы. Но я не знаю структуры, которая лежит ниже.Какова структура файлов .docx и .doc?

Какова основная структура файла .docx? Например, как долго заголовок? С какого момента начинается фактическое содержание документа? У него есть подпись в конце?

В принципе, что такое анатомия файла .docx?

+3

что у вас вопрос есть с C++? – UmNyobe

+0

один простой запрос к google: https://www.microsoft.com/en-us/download/details.aspx?id=14565 – Slavik

+0

Поскольку, если я понимаю эту структуру, мне нужно будет делать кодирование в C++ относительно. файловая структура docx @UmNyobe – DD25

ответ

3

Docx - это в основном zip-архив с большим количеством xml-файлов в нем. Это открытый формат, и документация доступна в Интернете. У wikipedia article есть общее описание и ссылки, которые вам нужны.

0

Ваш вопрос: «Что такое анатомия файла DocX?»

Пожалуйста, смотрите официальный OOXML статью "Анатомия OOXML" для примера DOCX структуры каталогов:

http://officeopenxml.com/anatomyofOOXML.php

Для документа пример DocX XML:

http://officeopenxml.com/WPsampleDoc.php

Однако, после тщательного наблюдения и угадывания, где детали стали туманными, мне не удалось сделайте файл docx.

Я выбрал этот короткий покрой: Создайте файл Docx в Libre бюро (поддерживает .docx расширения), сделать общий шаблон в формате из DOCX файлов вы ожидаете порождающими, сохраните файл как .docx, копировать и сохранять как .zip.

Открыть этот .zip-каталог, и, как вы увидите, мне было гораздо лучше объяснять спецификацию, чем приведенные выше официальные ссылки.

Смежные вопросы