2015-11-24 2 views
0

Есть ли способ, чтобы я мог отсканировать PDF-изображение и извлечь данные из изображения, выделив нужные поля? Мы ежедневно сканируем тысячи PDF-изображений сделок с недвижимостью и хотели бы иметь возможность автоматизировать процесс ввода данных. Проблема, с которой мы сталкиваемся, заключается в том, что никакие два дела не совпадают.Удаление данных PDF

+1

Ваш новый здесь, и поскольку у меня отсутствует ваш код и ошибки, с которыми вы сталкиваетесь. прочитайте, как спросить http://stackoverflow.com/help/how-to-ask И как создать минимальный, полный и проверенный пример http://stackoverflow.com/help/mcve. – davejal

ответ

0

В комментариях сказано, что Stackoverflow в основном касается проблем программирования.

Тем не менее, существуют возможности, в зависимости от фактических документов, и томов, подлежащих обработке.

На верхнем конце находится продукт Teleform, первоначально разработанный Кардиффом, и теперь принадлежащий HP, который используется для обработки бумажных форм; вы также можете посмотреть приложение Business Process Cardiff LiquidOffice, теперь HP LiquidOffice.

На нижнем конце я разработал приложение в формате PDF под управлением Acrobat, которое может принимать отсканированную и OCRd-форму и передавать данные в специально подготовленную заполняемую форму, откуда данные могут быть экспортированы в базы данных, например. Для получения дополнительной информации, демонстрации и цитаты, не стесняйтесь обращаться ко мне наедине.

Если вы хотите что-то разработать с помощью Acrobat, вы также можете начать с документа OCRd, а затем использовать возможности функции Redaction (или использовать инструмент Redaction Redax от Appligent) для поиска ключевых слов, а затем использовать позиционную информацию этих ключевых слов для извлечения большего количества данных.

Смежные вопросы