2012-03-14 3 views
1

Я разрабатываю приложение для Android, которое использует tesseract OCR (оптическое распознавание символов), и задавался вопросом, существует ли способ улучшения результатов для небольшого текста.Улучшение результатов Tesseract на Android

Я попытался перекомпилировать стандартный словарь с моими частыми и нормальными списками слов (используя wordlist2dawg) и не видел улучшения (я даже не могу сказать, помогает ли он!). Я также слышал, что можно изменить порог, при котором tesseract использует словарные слова, но я понятия не имею, как это сделать.

Если у кого-то есть представление о том, как я могу улучшить результаты, то tesseract дает мне, я был бы очень признателен!

ответ

3

Я знаю некоторые варианты, которые могут помочь вам:

  1. Добавить дополнительное пространство между границей изображения и текстом. Tesseract будет работать ужасно, если текст на изображении будет расположен на краю.
  2. Повторите свое изображение. Например, если вы выполняете OCR по слову «foobar», клонируете изображение и отправляете «foobar foobar foobar foobar foobar» в tesseract, результаты будут лучше.
  3. Google для обучения шрифтов и бинаризации изображений для tesseract.

Имейте в виду, что встроенные камеры в мобильных устройствах, в основном производят низкое качество изображения (размыли, носилась, перекос и т.д.) сам OCR представляет собой процесс comsuming ресурсов и если вы добавите достойное предварительную обработку изображения для того, младшие и средние мобильные устройства (которые, вероятно, имеют android) могут столкнуться с неожиданно низкой производительностью или даже нехваткой ресурсов. Это нормально для бесплатных/учебных проектов, но если вы планируете коммерческое приложение - подумайте об использовании лучшего SDK.

Взгляните на этот вопрос подробности: OCR for android

+1

Все хорошие предложения. Другое предложение - «исправить» проблему с небольшим текстом перед фактическим OCR. Изображение может быть увеличено или растянуто 2x или 3x в направлении x и y (пропорционально) для получения большего изображения с большим текстом, который многие OCR-движки могут читать лучше. Для этого требуется использовать некоторую библиотеку изображений, которая может «создавать» новые пиксели, а не переписывать dpi в заголовке изображения, но это относительно простая предварительная обработка. –

Смежные вопросы