2016-05-25 4 views
1

Я работаю над веб-приложением, которое должно иметь дело с заполненными форматами PDF (преобразование в веб-форму не является вариантом в этой ситуации, поскольку я имею дело с цифровыми подписанными PDF-файлами).Анализ данных в формате PDF в браузере с использованием Javascript

Приложение должно загрузить PDF-файл, проанализировать данные формы из PDF-файла в JSON и загрузить PDF-файл в качестве приложения к серверу CouchDB.

Части 1 и 3 просты, но я не смог найти способ извлечь данные PDF в браузере.

Как я понимаю, у меня есть три варианта:

  1. Реализовать или найти веб-сервиса (возможно обслуживание узла, используя нечто вроде pdf2json). Отправьте PDF-файл через AJAX, верните форматированные данные JSON. Я бы предпочел не делать этого, поскольку для этого требуется «лишний» вызов веб-службы, но может, если понадобится.

  2. Найти библиотеку, которая может обрабатывать разборчивость PDF в браузере (из данных с blobs/base64) и реализовать их использование.

  3. Преобразование модуля node.js, например pdf2json, в нечто, доступное в браузере, с помощью браузера или аналогичного.

Кто-нибудь реализовал разбор в формате PDF в браузере? Или мне нужно реализовать веб-сервис?

ответ

0

Не уверен, что это может получить формы, но PDF.js уже работает в браузерах.