Как уже упоминал Кенни, «связанная маркировка компонентов» описывает семейство алгоритмов, которые идентифицируют связанные пиксели. Подключенные компоненты также называются «подключенными областями» или «блоками», а также связанной концепцией «контуров». Любой такой алгоритм должен иметь возможность находить не только форму связанных пикселов переднего плана, но также наличие «дырок» внутри фигуры, состоящей из пикселей фонового цвета.
http://en.wikipedia.org/wiki/Connected-component_labeling
Этот алгоритм используется для нескольких областей техники, которые полагаются на обработке изображений, в том числе компьютерного зрения, машинного зрения и медицинской визуализации. Если вы собираетесь потратить какое-то время на обработку изображений, вы должны стать очень комфортно с этим алгоритмом и реализовать хотя бы один раз самостоятельно.
Библиотека OpenCV имеет функцию в findContours(), который может быть использован, чтобы найти контуры, контуры внутри контуров и т.д.
http://opencv.willowgarage.com/wiki/
Если вы хотите, чтобы увидеть алгоритм область мечения на работе, смотреть для ссылок на «подсчет клеток» с использованием приложения ImageJ. Подсчет биологических клеток является важным и часто цитируемым применением маркировки региона для медицинской визуализации.
http://rsbweb.nih.gov/ij/
Рассмотрим получение учебник по предмету, а не обучение по частям в Интернете. Изучение связанных компонентов (a.k.a. blobs) неизбежно приводит к рассмотрению бинаризации (пороговое значение a.k.a.), которое принимает оттенки серого или цветное изображение и генерирует из него черно-белое изображение. Если вы работаете с изображениями с камеры, освещение становится критическим, и для изучения требуется время и мастерство.
Существует множество других шагов предварительной обработки, которые могут потребоваться для очистки изображения. Необходимость предварительной обработки зависит от вашего приложения.
Вот учебник, который часто рекомендуется, и это дает хорошее покрытие стандартных методов обработки изображений:
цифровой обработки изображений по Гонсалес и Вудс, 3-е издание http://www.imageprocessingplace.com/
Перейти к addall.com найти дешевые копии. Международные издания дешевле.
Если символы (или другие фигуры) на изображении имеют согласованный размер и форму, например, «A» всегда имеет высоту 40 пикселей и 25 пикселей и печатает один и тот же шрифт - тогда вы может использовать «нормализованную взаимную корреляцию» или метод сопоставления шаблонов для идентификации наличия одной или нескольких совпадающих фигур. Этот метод может работать как очень грубый вид OCR, но имеет серьезные ограничения.
http://en.wikipedia.org/wiki/Template_matching
Я уверен, что вам нужно будет * распознать символы, чтобы их извлечь. OCR - это способ сделать это. –
@ M.Babcock: Не обязательно. Вы можете определить границы представления цифры в изображении, следуя смежным черным пикселям. – Douglas