2015-02-11 3 views
0

В настоящее время я пытаюсь переместить docx в файл mediawiki и сохранить правильные имена файлов в тегах [[Image:]]. По какой-то причине надлежащий файл изображения проглатывается (т.е. обычно это будет media/image4.jpg, но вместо этого он просто пуст).Преобразование docx в mediawiki и сохранение [[Image:]]

Я попытался извлечь docx и посмотреть на docx/word/_rels/document.xml.rels, но я не знаю, как определить, какие изображения дублируются. Я сделал простой скрипт для поиска/замены, но в одном файле у меня есть 130 тегов [[Image:]] и всего 105 изображений.

Таким образом, я хотел бы иметь выходной сигнал MediaWiki Фильтрующий собственное имя изображения, делая это:

soffice --headless --convert-to txt:MediaWiki myfile.docx 

Я на убунту 14.10.

Возможно ли это?

+0

Почему вы не можете просто вставлять изображения в файл документа? (Лично я также использовал бы подходящий формат документа, такой как OpenDocument odt.) – Nemo

+0

Поскольку это была корпоративная задача, конвертирование большого количества старых документов в формат mediawiki. Их нужно было взять как есть и правильно преобразовать, что я в конечном итоге сумел (см. Мой ответ). – Seiyria

+0

Ах. Из обоих вопросов и ответов не ясно, что вы конвертируете документы на страницы wikitext. – Nemo

ответ

0

Это не представляется возможным, но я написал обходное решение here, которое решает его. Длинным и коротким является то, что я конвертирую файл и управляю загрузкой/компоновкой изображений вручную.

Смежные вопросы