2017-01-27 4 views
0

Я преобразование DOCX файлов с помощью pandoc 1.16.0.2 и все работает отлично, за исключением сразу же после каждого изображения, атрибуты размера показываются в виде текста в TehКак избежать тегов размера img при уценке при преобразовании docx в уценку?

![](./media/media/image4.png){width="3.266949912510936in" 
height="2.141852580927384in"} 

Так показывает штраф изображения в мДе, но также тег размера как обычный текст прямо за/после/под каждым изображением. Команда, я использую это:

pandoc --extract-media ./media2 -s word.docx markdown -o exm_word2.md 

Я прочитал инструкцию, как лучшее, что я могу, но не вижу каких-либо флагов использовать для управления этим. Кроме того, большинство поисковых запросов приближаются, когда люди хотят иметь атрибуты и управлять ими.

Любые предложения, чтобы убить атрибуты размера или мое приложение для разметки (MarkdownPad2 - v-2.5.x), читая это md неправильно?

ответ

1

Вы можете написать фильтр, чтобы сделать это. Вам нужно будет установить panflute. Сохранить как remove_img_size.py:

import panflute as pf 


def change_md_link(elem, doc): 
    if isinstance(elem, pf.Image): 
     elem.attributes.pop('width', None) 
     elem.attributes.pop('height', None) 
    return elem 


if __name__ == "__main__": 
    pf.run_filter(change_md_link) 

Затем компилировать с

pandoc word.docx -F remove_img_size.py -o exm_word2.md 
+0

Я постоянно получаю "pandoc: запуск Ошибка фильтра remove_img_size.py ФД: 4: hPutBuf: ресурс исчез (сломанный труба)", несмотря на возможность для запуска этого фильтра непосредственно в python3. Это на докер-контейнере, который может быть закрыт, так что он будет перестраиваться и проверяться. Спасибо! – wedward

+0

@wedward выглядит как ошибка haskell, так что это может иметь отношение к вашей версии pandoc (я тестировал с помощью pandoc 17.1) – scoa

Смежные вопросы