2012-01-30 2 views
-1

Мой новый проект конвертирует HTML в PDF на лету, используя URL-адрес. Я много раз искал в свой первоначальный период и придумывал решение, чтобы конвертировать HTML в IMAGE и IMAGE в PDF. Но это не идеальное решение, так как пользователь не может скопировать пасту из файла PDF.Как работает HTML в PDF (специально abcPDF)

Недавно я наткнулся ABCpdf компонент, вы можете проверить их демо здесь http://www.abcpdfeditor.com/

Теперь я задаюсь вопросом, как они способны производить такой хороший PDF со всеми такой функции. Какова будет их логика? Я не думаю, что они будут разбирать каждый HTML-тег для создания документа. У вас есть идеи?

Любая помощь будет оценена

+0

они должны использовать какой-то механизм парсера/рендеринга HTML - например, WebKit или подобное ... но я думаю, что этот вопрос слишком общий для SO! – Yahia

+0

@Yahia Хорошо, я понял, но как они получают выход в веб-набор для PDF? Это не образ. Как можно построить PDF из данного HTML? У меня нет идеи здесь – user867198

+0

Я не думаю, что вы понимаете, о чем идет речь ... ТАК для конкретных вопросов программирования ... ваш вопрос слишком общий, можно написать целую книгу в качестве ответа ... – Yahia

ответ

2

Короче говоря, это как большинство HTML для преобразования PDF работает.

HTML ---- Конвертирована в ----> EMF (метафайл/векторные изображения) ----> PDF

  1. В принципе, движок рендеринга IE (то есть, MSHTML) имеет некоторые API, с помощью которых вы можете экспортировать загруженную HTML-страницу в виде Emf (расширенный формат метафайла), который представляет собой не что иное, как векторное изображение.

Вы можете использовать этот контроль веб-браузера с открытым исходным кодом для этой цели.
http://groups.google.com/group/csexwb

  1. Тогда вы должны вынести сгенерированный файл EMF на PDF-странице. Обычно это называется преобразованием EMF в PDF. Основываясь на моем понимании, нет бесплатного программного обеспечения для преобразования Emf в PDF. Но ITextsharp обеспечивает минимальную поддержку формата WMF.