2015-10-11 2 views
1

Я пытаюсь преобразовать большой документ docx с упорядоченным списком нескольких слоев в html. (См пример документа здесь: http://docdro.id/X1oyfBv Вы должны загрузить его)конвертировать docx с (упорядоченным) списком в html

Я попытался следующие вещи, в том числе:

  • онлайн конвертеры, такие как HTML-уборщика и index.html (которые распознают только один слой списка)

  • сохранить как html - который создает ужасный файл, но до сих пор не распознает структуру ol.

  • сохранил файл как молния, а затем открыл файл XML, но я не вижу легкий способ получить структуру ола из W: ... тегам

  • сохранить его на Google Docs и работают сценарий Омар Alzabir в http://omaralzabir.com/wp-content/uploads/2014/05/GoogleDocsEmail.jpg

кстати. Если я создам файл слов с упорядоченным списком с несколькими слоями и я его конвертирую, он распознает его как ol. Но существующий файл не распознается как ol, даже если я «un-list» и перечислил его снова. Так что, возможно, есть что-то не так с тем, как был создан оригинальный документ

Любые предложения высоко ценится :) Или указания относительно того, почему эта проблема возникает

+0

Сохранить это как .docx и посмотреть, если он работает – Dipak

+0

@Dipak вот что я сделал – Maaike

ответ

0

Вы можете использовать pandoc (?): https://github.com/jgm/pandoc

Это универсальный инструмент командной строки с открытым исходным кодом для преобразования файлов документов на основе разметки.

Вы можете использовать его как-то вроде этого:

pandoc -o output.html input.docx 
+0

спасибо! на самом деле для документа, создавшего его, и создания тегов ol. для реального большого документа теги ol не распознаются, а вместо этого создаются p-метки с номерами 1,2 и т. д. hardcoded. Я могу видеть, могу ли я создать лучший пример doc для последнего случая – Maaike

Смежные вопросы