2013-05-15 2 views
4

У меня есть запрос от клиента, который хочет предоставить питание пожилым людям в разных местах. Для этого люди заполняют форму на неделю и галочки в зависимости от их выбора на каждый день (это также учитывает особые требования).Сканирование и чтение документа с пометкой

Например:

Name 
Commune 

        With salt ()  Without salt [] 

Mon :  Meal 1 ()     Meal 2 () 
      Dessert 1 ()     Dessert () 

Tues :  Meal 1 ()     Meal 2 () 
      Dessert 1 ()     Dessert () 

Данные из каждого листа, то должен быть составлен, чтобы сказать нам, сколько каждый вид пищи подготовить каждый день для каждой коммуны ...

Листов все равно, поэтому я надеюсь, что смогу их отсканировать и автоматически прочитать.

Я не знаю ни одного программного обеспечения, которое позволяет мне это делать. Каков наилучший способ решения этой задачи? На данный момент я смотрю на tesseract, но, может быть, есть более простая техника?

EDIT: мы говорим о нескольких сотнях форм в неделю. в идеале мы будем сканировать их в одно и то же время, извлекать данные и хранить формы в электронном виде.

ответ

7

Вы ищете не OCR, что подразумевает чтение печатных машин. Вы ищете программное обеспечение ICR/OMR, которое также известно как обработка формы или сбор данных. OMR означает Optical Mark Recognition, которое вы пытаетесь сделать, распознаете значение флажков/флажков.

Дополнительная информация о распознавания рукописного текста здесь: ICR for machine printed text?

Потому что ваши формы одинаковы, это означает, что ваши формы попадают в категорию «основных форм» и на основе шаблона пакета программного обеспечения может обрабатывать эти формы. Вот краткий документ, объясняющий различия между типами форм: www.wisetrend.com/files/Structured_vs_Semi-Structured.pdf

Ваша пустая форма также должна быть правильно разработана для распознавания машины. Он должен иметь контрольные метки для лучшего выравнивания шаблона, прозрачный поток, чтобы пользователи знали, как его заполнять естественно, флажки соответствующего размера и т. Д.

Я считаю, что FlexiCapture сделает все, что вам нужно: link. Существует, по крайней мере, несколько других решений, которые могут выполнять аналогичный процесс. Я работаю интегратором/консультантом для бумажных проектов обработки форм.

Я удалил ваш «мобильный» тег, так как считаю, что вы не собираетесь использовать сотовый телефон для захвата этих изображений. Если да, я бы посоветовал, если у вас есть другие варианты. Вы упомянули сканирование их на обычном сканере, что является лучшим вариантом для достижения хорошего качества изображения. Поверьте мне, вам будет достаточно иметь дело с обработкой человеческих рукописных форм, чтобы максимально оптимизировать ваши формы, сканирование, программное обеспечение и процесс.

Если вам интересно разработать его самостоятельно, это возможно. Процесс состоит в том, чтобы сравнить область изображения (каждая галочка) с некоторой «базой», чтобы увидеть, есть ли дополнительная ручная запись для этой области. Если над некоторым порогом, то галочка была проверена. Типичными проблемами являются выравнивание областей и пограничных пороговых уровней (малая/светлая отметка). Коммерческие пакеты обрабатывают это автоматически.

Пожалуйста, дайте мне знать, если вам нужно дополнительное руководство.

ilya evdokimov

+1

Спасибо, фантастический ответ. Сначала мы посмотрим на коммерческое программное обеспечение, и в случае необходимости я могу разработать что-то обычай. –

Смежные вопросы