2013-03-27 2 views
15

Я планирую разработать приложение, такое как Word Lens. Может ли кто-нибудь предложить хорошую библиотеку, которую я могу использовать? или кто-нибудь объясняет технологию, лежащую в основе приложения Word Lens? это совпадение времени изображения барабана или OCR? Я знаю некоторую библиотеку обработки изображений, такую ​​как OpenCv, tesseract ... Любая помощь приветствуется ...Real TIme Image Processing (OCR)

ответ

42

Я один из создателей Word Lens. Несмотря на то, что там есть некоторые библиотеки OCR (например, tesseract), мы решили сделать наши собственные, чтобы добиться лучших результатов и производительности. Наш общий алгоритм выглядит следующим образом:

  1. копию изображения с камеры и получить его в оттенках серого компонента
  2. выравнивать изображение, поэтому текст четко выделяется на фоне
  3. отрисовки коробки вокруг вещей, которые выглядят как символы & предложения
  4. do OCR: сопоставить пиксели в каждом поле с базой данных символов - это на самом деле довольно сложно!
  5. собрать символы в слова, посмотреть в словаре (это трудно тоже, потому что будут ошибки в OCR)
  6. рисуют результаты обратно на изображение

соответствие изображения сам по себе не достаточно хорошо, из-за огромного разнообразия шрифтов, слов и языков.

OpenCV - отличная библиотека, с которой можно начать и работать, и узнать больше о компьютерном зрении в целом. Я бы рекомендовал строить свои примеры и играть там. Повеселись!

+0

Вы бы получили лучшие результаты, объединив 4 и 5 в некотором роде? Как аутсайдер для OCR, мне кажется, что вы потеряли информацию на «5», которая может быть полезна в трудных случаях. –

+1

martin: совершенно верно; например, «O» очень похож на «0» или даже на «8» и «B», поэтому он помогает сохранять списки возможностей, а затем обрезать их на следующих этапах, когда доступна более подробная информация об устранении неоднозначности (простой вид обратной связи) –

+0

@jd. Спасибо за ваш комментарий .. могу я знать, сколько времени вам понадобилось для создания Word Lens? не могли бы вы предложить хорошие учебные пособия для OCR? –