Я работаю над приложением, в котором pdf преобразуется в html5 на «pdf.js». Требования к проекту заключаются в том, что html, созданный pdf.js, должен содержать текст pdf в источнике просмотра страницы, чтобы мы могли выполнять наши дальнейшая обработка на нем.Как получить текст, полученный pdf.js в источнике просмотра страницы?
Я прочитал эту статью http://www.codeproject.com/Articles/466362/Blend-PDF-with-HTML, но у нее нет возможности для рендеринга текста. Также это http://git.macropus.org/2011/11/pdftotext/example/
Как получить текст в формате pdf в виде divs в источнике просмотра страницы при преобразовании в html5 через pdf.js?
https://github.com/mozilla/pdf.js/tree/master/examples/text-only – async5
есть также svg backend для pdf.js, вам может потребоваться использовать это вместо холста – async5
, являющегося как текст создается через Javascript, он никогда не появится в источнике просмотра страницы. Просмотр источника страницы показывает необработанный HTML до запуска любого javascript. – levi