2014-01-07 2 views
5

Я использую PhantomJS для преобразования многих (+500) веб-страниц в документы PDF. Проблема в том, что я получаю довольно большие файлы PDF (около 900 кб) для относительно небольших страниц - 70 кб с изображениями. Почему они такие большие? Простой «Сохранить в PDF» в Firefox создает файл размером 200 кб, что отлично. Мне скоро придется обрабатывать многие другие страницы, и размер файла, скорее всего, будет проблемой. Любое предложение?PhantomJS создает большой PDF

EDIT: Вот два примера: выход из PhantomJS и Firefox save to PDF

+2

Если возможно, используйте профессиональный инструмент, такой как Acrobat Pro для аудита вашего PDF - он расскажет вам, куда все байты пошли. Если нет, отправьте ссылку на образец онлайн. Скорее всего, проблема заключается в самой PhantomJS, т. Е. Неспособной сжимать как можно более жесткой, а не подмножества шрифтов. – usr2564301

+0

Я согласен с Jongware, используйте какой-нибудь инструмент pdf, чтобы выяснить проблему. Моя ставка заключается в том, что phantomjs не делает никакого сжатия. – JasonS

ответ

2

Даже я столкнулся с той же проблемой. Я пытался уменьшить размер PDF, когда есть большой объем данных. Я заметил, что если вы сбрасываете текстовое содержимое (примеры абзацев, табличные данные, описание и т. Д.) Внутри любого из этих тегов заголовков (h1, h2 ... h6), эта часть содержимого будет отображаться как текст в pdf, а не как изображение. Это уменьшит размер файла PDF.

Я не уверен, почему содержимое внутри тегов div, p, span не рассматривается как текст, а как изображение в pdf.

Смежные вопросы