2015-01-12 2 views
1

Есть ли простой способ экспортировать весь сайт Пеликан в формате pdf, отсортированный по категориям?экспортировать весь сайт пеликана в формате pdf?

Я пробовал перетаскивать карту сайта html в калибр, но это тоже всасывает навигацию, чего я не хочу.

Было бы легко извлечь только содержимое с html-страниц в выходной папке с помощью python, но затем страницы не сортируются по категориям.

Я могу преобразовать файлы .md в pdf с pandoc, но у меня есть изображения planturl, созданные из уценки плагином, поэтому это не сработает, потому что в pdf не будет графики.

Любые идеи?

ответ

0

Лучшее место для начала - это, вероятно, PDF plugin. README только упоминает reST, поэтому я не уверен, поддерживается ли Markdown, но если нет, возможно, это будет расширено для этого.

3

Hacky homerolled решение: - Я написал extractDivs.py https://gist.github.com/stevepowell99/335ef06fe2b35b9317ed пройти через выходную папку и просто извлечь статью DIV с каждой должности, а затем положить это в моем Makefile, после того, как пеликан пробегов:

python extractDivs.py 
pandoc -s -S output/all.html -o output/book.html -c ../pelican-themes/monospace/static/css/main.css 
wkhtmltopdf --footer-right [page] --footer-left [section] -R 30 -L 30 -T 30 -B 30 --outline toc ./output/book.html ./output/book.pdf 

так pandoc берет извлеченные divs и помещает их в один файл с тем же css, что и мой cite, а затем wkhtmltopdf преобразуется в pdf.

Yuk.

+0

Работает ли это с изображениями? – Lionel

Смежные вопросы