2014-02-19 9 views
5

У меня есть проект, который должен сканировать определенные изображения с помощью OCR. Я знаю, что программа abbyy finereader очень хорошо (также попробовала пробную версию, которая работает почти отлично для меня), и теперь мне интересно, как вставить это программное обеспечение в python или другой язык sripting, чтобы я мог позже просто запустить командную строку сценарий, например python the_script.py image.jpg сделать снимок как параметр, выполнить abbyy finereader вместе с ним и вернуть признанный текст ...Использование командной строки Abbyy Finereader/использование python?

Я не смог найти способ в google, нет ли !? Я только нашел что-то вроде этого: https://github.com/mikesname/python-ocrlab/blob/master/ocrsite/ocrlab/nodes/abbyy.py , но не мог понять, что это действительно делает ...

Или какая часть программного обеспечения Abbyy я должен был бы сделать это !? Сервер распознавания или движок OCR или что-то еще?

Большое спасибо заранее

+0

Я думаю, вы должны получить пробную лицензию от ABBYY и просто спросить их. Если Я не ошибаюсь, вы имеете право на поддержку в течение пробного периода. Я пробовал их облачный sdk, и есть пример командной строки, описанный в python. Я предполагаю, что это будет одинаково для всех их продуктов sdk. –

+0

Может быть интересно в этих Linux [shell-скриптах] (https://github.com/cove/scanbd), как предоставлено xorgar831 [здесь] (https://news.ycombinator.com/item?id=12416607) – zelusp

ответ

8

Я работаю с технологией ABBYY уже более 15 лет. Раньше я работал в ABBYY, и теперь я работаю для WiseTREND - одной из основных технологий VAR и интегратора ABBYY в США.

FineReader, а именно розничная продукция в розницу, предназначен для автономного интерактивного использования оператором. Командная строка и автоматизация API недоступны в этом пакете. Если вы используете небольшой объем, вы можете использовать FineReader Corporate Edition в качестве простого черного ящика, настроить его как горячую папку, а ваш сценарий удалить изображения в эту папку ввода, дождаться обработки и выбрать из папки вывода.

Для лучшей автоматизации и интеграции необходимо использовать другой продукт, отличный от FineReader.

Сначала решите, хотите ли вы иметь локальное программное обеспечение или облачное OCR.

Cloud - ABBYY, OCR-IT и несколько других поставщиков предлагают OCR через веб-запрос. Обычно оплата за страницу, и не требуется покупка программного обеспечения.

Local - некоторое программное обеспечение будет работать на вашем сервере и предоставить ваши скрипты с функциями OCR, как черный ящик, так и с помощью прямого API. Recognition Server является следующим продуктом для рассмотрения. Наконец, если вы разрабатываете большое приложение с необходимостью распространять его среди многочисленных пользователей или нуждаетесь в глубоком контроле OCR, тогда Engine SDK - это продукт, который следует учитывать.

Если вы хотите поделиться еще тем, как вы хотите интегрировать OCR, а также то, какие объемы и функции вам нужно достичь, мы можем попытаться сузить еще больше.

+0

Я свяжусь с вами по почте касательно суженного совета продукта - ответ на вопрос (использование командной строки finereader), спасибо за это! – tim

4

Я видел это сообщение очень поздно, но я использую командную строку ABBYY в течение 10 лет.

Я предпочитаю ABBYY 8, потому что он делает такую ​​же хорошую работу быстрее и не открывает какой-либо графический интерфейс. Он поставляется с FineOCR.exe:

"C: ... \ ABBYY FineReader 8 \ FineOCR.exe" % 1/языки греческий английский/отправить MSWord

Это делает OCR и открывает MS Word. Файл FineOCR.txt представляет собой простой файл справки.

Относительно ABBYY 11, 12 (все версии) есть FineCmd.exe. Используя что-то вроде:

"c: ... \ FineReader \ FineCMD.ехе»% 1/языки греческий английский/отправить MsWord

Он делает то, что сделал FineOCR раньше (но не .txt файл справки).

Смежные вопросы