Я использую этот набор данных: http://www.robots.ox.ac.uk/~vgg/data/hands/Как подготовить положительные изображения для обучения HAAR для обнаружения рук?
Однако, я только собираюсь использовать руки, которые> 4200 квадратных пикселей в области, которая оставляет меня всего 621 рук. Я понял, что этого может быть недостаточно & При необходимости я буду искать больше изображений. Тем не менее, все изображения аннотируются следующим образом:
У меня есть координаты прямоугольника следующим образом:
Тем не менее, ограничивающий прямоугольник не совпадает с осью Y X & ,
Я считаю, что мне нужно обрезать руки из изображения. У меня есть 2 способа сделать это:
1) пусть xmin и xmax будут минимальными и максимальными координатами x рамки. В то время как ymin & ymax - это минимальные & максимальные координаты y. Если вы сделаете это, я получу это:
(без рамки, конечно) В основном, часть фона остается в приведенном выше.
2) Я могу использовать двоичную маску, чтобы «замаскировать» все пиксели в пределах ограничивающего прямоугольника. Если я сделаю это, размер моего изображения будет по-прежнему от xmin до xmax & ymin до ymax, однако я могу установите остальную часть фона в белый цвет.
Что будет лучше? Я считаю, что положительные стороны должны содержать только объект интереса (руки в этом случае), поэтому оставить фон может быть неправильным? , был бы белый фон в порядке?
Основная проблема здесь в том, что ограничивающая рамка не выровнена!
Хорошо, конечно! Я попробую! –