1

Я использую этот набор данных: http://www.robots.ox.ac.uk/~vgg/data/hands/Как подготовить положительные изображения для обучения HAAR для обнаружения рук?

Однако, я только собираюсь использовать руки, которые> 4200 квадратных пикселей в области, которая оставляет меня всего 621 рук. Я понял, что этого может быть недостаточно & При необходимости я буду искать больше изображений. Тем не менее, все изображения аннотируются следующим образом:

enter image description here

У меня есть координаты прямоугольника следующим образом: enter image description here

Тем не менее, ограничивающий прямоугольник не совпадает с осью Y X & ,

Я считаю, что мне нужно обрезать руки из изображения. У меня есть 2 способа сделать это:

1) пусть xmin и xmax будут минимальными и максимальными координатами x рамки. В то время как ymin & ymax - это минимальные & максимальные координаты y. Если вы сделаете это, я получу это:

enter image description here (без рамки, конечно) В основном, часть фона остается в приведенном выше.

2) Я могу использовать двоичную маску, чтобы «замаскировать» все пиксели в пределах ограничивающего прямоугольника. Если я сделаю это, размер моего изображения будет по-прежнему от xmin до xmax & ymin до ymax, однако я могу установите остальную часть фона в белый цвет.

Что будет лучше? Я считаю, что положительные стороны должны содержать только объект интереса (руки в этом случае), поэтому оставить фон может быть неправильным? , был бы белый фон в порядке?

Основная проблема здесь в том, что ограничивающая рамка не выровнена!

ответ

0

Оставляя небольшое количество фона в порядке, оно будет различным в каждом изображении и поэтому не будет создано как часть классификатора.

Я бы предложил сделать больший отрицательный набор для отмены фона и 620 изображений будет хорошо.

+0

Хорошо, конечно! Я попробую! –

0

Вы также можете захотеть взглянуть на labelme http://labelme.csail.mit.edu/Release3.0/index.php

я использовал, что для моего проекта, и они также показать вам, как использовать амазонка турка, чтобы получить свои собственные наборы данных. Я думаю, вы также сможете использовать свои наборы данных.

Смежные вопросы