2012-02-20 4 views
12

Я создаю приложение iOS (делаю снимок и запускаю OCR на нем) с помощью Tesseract (библиотека OCR), и он отлично работает с хорошо написанными числами и символами (используя обычные шрифты).7-сегментный дисплей OCR

Проблема, с которой я столкнулась, заключается в том, что если я попробую на 7-сегментном дисплее, это даст очень плохие результаты.

Итак, мой вопрос: кто-нибудь знает, как я могу подойти к этой проблеме? Есть ли способ, чтобы Tesseract распознал эти персонажи?

+3

Забавно, что (независимо от этого конкретного пакета), гораздо проще идентифицировать 7 сегментных символов - простая обработка изображений - обнаружение края, а затем поиск длин и направлений приводит вас к полпути – Ofir

ответ

9

Мне тоже было очень трудно получить tesseract для распознавания цифр с изображений ЖК-дисплеев.

я имел некоторый незначительный успех путем предварительной обработки изображения с ImageMagick для наложения копии изображения на себя с небольшим сдвигом по вертикали, чтобы заполнить промежутки между сегментами:

$ composite -compose Multiply -geometry +0+3 foo.tif foo.tif foo2.png 

В конце концов , хотя, моя спасительная благодать была «Семь сегментов оптического распознавания символов» двоичная: http://www.unix-ag.uni-kl.de/~auerswal/ssocr/

Большое спасибо автору, Эрик Ауэрсвальда, для этого кода!

+0

Как запустить ssocr на iOS? – phnmnn

+0

Как вы использовали в андроиде? –

2

Я не пробовал OCRing 7-сегментный дисплей, но я подозреваю, что проблема может быть вызвана тем, что символы не являются подключенными компонентами. Тессеракт не обрабатывает отключенные шрифты хорошо из моего опыта.

Простая эрозия (предварительная обработка изображений) может помочь, соединяя сегменты, но вам придется протестировать ее и играть с размером ядра, чтобы предотвратить слишком много искажений.

+0

Да, я это знаю. Я попробовал раскрасить пиксели сам, просто попробовав OCR на картинке (с подключенными цифрами), и он все равно не работает. Вероятно, потому что шрифт странный, поэтому я пытаюсь работать с шрифтом. Thx для вашего ответа anw :) – Karim

+2

Затем, поезжайте tesseract, используя этот шрифт. Скорее всего, лучше использовать шрифты после сегментов коннекции, но вам лучше попробовать оба (использовать оригинал и подключенные шрифты), чтобы лучше видеть. –