Я написал код Python (извините, не C++), который позволит маскировать адаптивное пороговое значение. Это не очень быстро, но он делает то, что вы хотите, и вы можете использовать его в качестве основы для кода на C++. Он работает следующим образом:
- Устанавливает замаскированные пиксели в изображении на ноль.
- Определяет количество незамаскированных соседей в блоке свертки для каждого пикселя.
- Выполняет свертку и усредняет ее количеством невидимых соседей внутри блока. Это дает среднее значение в блоке окрестности пикселей.
- Пороговые значения, путем сравнения изображений со значениями средней окрестности,
mean_conv
- Добавляет скрытую (не пороговую) часть изображения обратно.
Изображения показывают, исходное изображение, маску, окончательный обработанное изображение.
Вот код:
import cv
import numpy
from scipy import signal
def thresh(a, b, max_value, C):
return max_value if a > b - C else 0
def mask(a,b):
return a if b > 100 else 0
def unmask(a,b,c):
return b if c > 100 else a
v_unmask = numpy.vectorize(unmask)
v_mask = numpy.vectorize(mask)
v_thresh = numpy.vectorize(thresh)
def block_size(size):
block = numpy.ones((size, size), dtype='d')
block[(size - 1)/2, (size - 1)/2] = 0
return block
def get_number_neighbours(mask,block):
'''returns number of unmasked neighbours of every element within block'''
mask = mask/255.0
return signal.convolve2d(mask, block, mode='same', boundary='symm')
def masked_adaptive_threshold(image,mask,max_value,size,C):
'''thresholds only using the unmasked elements'''
block = block_size(size)
conv = signal.convolve2d(image, block, mode='same', boundary='symm')
mean_conv = conv/get_number_neighbours(mask,block)
return v_thresh(image, mean_conv, max_value,C)
image = cv.LoadImageM("image.png", cv.CV_LOAD_IMAGE_GRAYSCALE)
mask = cv.LoadImageM("mask.png", cv.CV_LOAD_IMAGE_GRAYSCALE)
#change the images to numpy arrays
original_image = numpy.asarray(image)
mask = numpy.asarray(mask)
# Masks the image, by removing all masked pixels.
# Elements for mask > 100, will be processed
image = v_mask(original_image, mask)
# convolution parameters, size and C are crucial. See discussion in link below.
image = masked_adaptive_threshold(image,mask,max_value=255,size=7,C=5)
# puts the original masked off region of the image back
image = v_unmask(original_image, image, mask)
#change to suitable type for opencv
image = image.astype(numpy.uint8)
#convert back to cvmat
image = cv.fromarray(image)
cv.ShowImage('image', image)
#cv.SaveImage('final.png',image)
cv.WaitKey(0)
После написания этого я нашел this great link, что есть хорошее объяснение с большим количеством примеров изображений, я использовал их изображение текста для приведенного выше примера.
Примечание. Ненужные маски, похоже, не соблюдаются scipy signal.convolve2d()
, поэтому описанные выше обходные пути были необходимы.
Большое спасибо за ваш ответ. Я исследую ваше предложение. Quentin –
@Quentin Geissmann - Вы получили его в своем коде на C++? – fraxel
Я думаю, что я понял, как реализовать, не делая его очень медленным ... Но еще не реализовано. :) спасибо –