Представьте короткий видеоролик, как этот: черный фон, линия белого текста в центре, которая постепенно заполняется красным цветом, а не буква буквами, но каждая отдельная буква заполняется постепенно. Вот упрощенное изображение, которое иллюстрирует это:Признавая текст на картинке
(Существует куча кадров между ними, но они опущены для простоты.)
Таким образом, по прошествии некоторого времени (например, 10 секунд) вся строка будет красной.
Теперь задача, которую я должен решить:
- Я должен признать начальную строку, таким образом, я должен получить «привет мир» в качестве результата.
- Не только это. Для каждый письмо Я должен узнать, в какой момент он начинает заполняться, и в какой момент он полностью заполнен.
Вывод может быть такой:
H,0ms,1000ms E,1000ms, 1500ms L,1500,2500ms L,2500ms,3500ms O,3500ms,4000ms
... и так далее.
Скорость может отличаться для разных букв. Размер шрифта и шрифта всегда один и тот же. Набор символов включает буквы нижнего и верхнего регистра.
Я рассмотрел два подхода: распознавание распознавания или нейронную сеть. У меня тоже мало опыта.
Я предполагаю, что подход OCR позволит мне легко распознать текст. Но как я узнаю не заполненные и заполненные письма?
Подход нейронной сети, вероятно, позволит мне распознать как незаполненные/заполненные буквы, но для этого я должен разбить изображение на отдельные буквы, что само по себе может быть сложной задачей.
Есть ли другие варианты? Или заданы два варианта выше, какой из них вы бы порекомендовали и как бы вы обошли проблемы, изложенные для двух подходов?
См., Например, http://www.mathworks.com/help/vision/examples/automatically-detect-and-recognize-text-in-natural-images.html. – user1929959
Pvael, что ты в итоге сделал? –