Я хочу превратить отсканированные изображения в черно-белые изображения, цель состоит в том, чтобы уменьшить размер файла до того, как изображения будут переданы через Интернет для OCR.Бинаризация изображения для OCR
Обычные бинаризационные/черно-белые изображения, созданные сканерами/общим программным обеспечением для редактирования изображений, создают нежелательные результаты.
Множество случайных черных пикселей оставлено позади, которые действительно являются просто шумом от бинаризации, это приводит к тому, что OCR пытается распознать символы там, где их нет, или вставить полные стопы, двоеточия и т. Д. После символов.
Что я могу использовать в OpenCV, чтобы разбить изображение, сохранить линии, символы & темные области сплошного и уменьшить шум пикселей в белых областях?
Я играл с cvThreshold и cvAdaptiveThreshold, но результаты пока невелики.
В качестве примера ознакомьтесь с этим original image и desired result.
Ваш пример, кажется, триниальный, я вижу по крайней мере один оттенок серого в дополнение к черно-белым. –
@MarkRansom Когда я вернулся и посмотрел изображения в IrfanView, я думал, что вы правы, и я должен был сэкономить изображение B & W неправильно. Однако при просмотре изображений в Gimp пиксели - это только черно-белые. Что вы используете для просмотра изображения? В моем случае я доверяю gimp над IrfanView. – Michael
Я смотрел на него в Chrome. Сегодня в Firefox это выглядит хорошо, не знаю, что произошло. –