Вы ищете не OCR, что подразумевает чтение печатных машин. Вы ищете программное обеспечение ICR/OMR, которое также известно как обработка формы или сбор данных. OMR означает Optical Mark Recognition, которое вы пытаетесь сделать, распознаете значение флажков/флажков.
Дополнительная информация о распознавания рукописного текста здесь: ICR for machine printed text?
Потому что ваши формы одинаковы, это означает, что ваши формы попадают в категорию «основных форм» и на основе шаблона пакета программного обеспечения может обрабатывать эти формы. Вот краткий документ, объясняющий различия между типами форм: www.wisetrend.com/files/Structured_vs_Semi-Structured.pdf
Ваша пустая форма также должна быть правильно разработана для распознавания машины. Он должен иметь контрольные метки для лучшего выравнивания шаблона, прозрачный поток, чтобы пользователи знали, как его заполнять естественно, флажки соответствующего размера и т. Д.
Я считаю, что FlexiCapture сделает все, что вам нужно: link. Существует, по крайней мере, несколько других решений, которые могут выполнять аналогичный процесс. Я работаю интегратором/консультантом для бумажных проектов обработки форм.
Я удалил ваш «мобильный» тег, так как считаю, что вы не собираетесь использовать сотовый телефон для захвата этих изображений. Если да, я бы посоветовал, если у вас есть другие варианты. Вы упомянули сканирование их на обычном сканере, что является лучшим вариантом для достижения хорошего качества изображения. Поверьте мне, вам будет достаточно иметь дело с обработкой человеческих рукописных форм, чтобы максимально оптимизировать ваши формы, сканирование, программное обеспечение и процесс.
Если вам интересно разработать его самостоятельно, это возможно. Процесс состоит в том, чтобы сравнить область изображения (каждая галочка) с некоторой «базой», чтобы увидеть, есть ли дополнительная ручная запись для этой области. Если над некоторым порогом, то галочка была проверена. Типичными проблемами являются выравнивание областей и пограничных пороговых уровней (малая/светлая отметка). Коммерческие пакеты обрабатывают это автоматически.
Пожалуйста, дайте мне знать, если вам нужно дополнительное руководство.
ilya evdokimov
Спасибо, фантастический ответ. Сначала мы посмотрим на коммерческое программное обеспечение, и в случае необходимости я могу разработать что-то обычай. –