2014-08-27 1 views
0

Я работаю над приложением, в котором pdf преобразуется в html5 на «pdf.js». Требования к проекту заключаются в том, что html, созданный pdf.js, должен содержать текст pdf в источнике просмотра страницы, чтобы мы могли выполнять наши дальнейшая обработка на нем.Как получить текст, полученный pdf.js в источнике просмотра страницы?

Я прочитал эту статью http://www.codeproject.com/Articles/466362/Blend-PDF-with-HTML, но у нее нет возможности для рендеринга текста. Также это http://git.macropus.org/2011/11/pdftotext/example/

Как получить текст в формате pdf в виде divs в источнике просмотра страницы при преобразовании в html5 через pdf.js?

+0

https://github.com/mozilla/pdf.js/tree/master/examples/text-only – async5

+0

есть также svg backend для pdf.js, вам может потребоваться использовать это вместо холста – async5

+0

, являющегося как текст создается через Javascript, он никогда не появится в источнике просмотра страницы. Просмотр источника страницы показывает необработанный HTML до запуска любого javascript. – levi

ответ

0

PDF.JS предоставляет только текстовый слой, который добавляется поверх зрителя, чтобы разрешить выбор текста, он не создает div для изображений и графики - эти артефакты отображаются на холсте html5.

Смежные вопросы