1

У меня вопрос об увеличении данных для обучения глубокой нейронной сети для обнаружения объектов.Усовершенствование данных для обнаружения объектов с использованием глубокого обучения

У меня довольно ограниченный набор данных (около 300 изображений). Я увеличил данные, повернув каждое изображение с 0-360 градусов с шагом 15 градусов. Следовательно, я получил 24 повернутых изображения из одного. Таким образом, я получил около 7200 изображений. Затем я нарисовал ограничительную рамку вокруг объекта интереса к каждому дополненному изображению.

Как представляется, разумный подход к улучшению данных?

С наилучшими пожеланиями

+0

Во время тестирования вы ожидаете изображения во всех этих углах? Тогда да. Однако, если все ваши тестовые изображения будут вертикальными, возможно, с небольшими вращениями, то нет. В этом случае вы должны использовать только вращения в диапазоне, который вы ожидаете иметь в реальных данных. – hbaderts

ответ

2

Для подготовки хорошей модели вам нужно много представителя данных. Ваше увеличение является репрезентативным только для поворотов, так что да, это хороший метод, если вы обеспокоены тем, что не достаточно поворота объектов. Однако это никоим образом не поможет с обобщением на другие объекты/преобразования.

+0

Благодарим вас за ответ. Поскольку я намерен обнаруживать поддоны на складе, используя глубокий подход к обучению. Я планирую применить Faster R-CNN для этой цели. Как вы рассматриваете этот алгоритм для обнаружения в реальном времени? или вы предложите что-нибудь еще? –

+1

Ускоренный R-CNN работает около 10 Гц, вы можете попробовать с помощью YOLO, если вы ищете обнаружение в реальном времени http://pjreddie.com/darknet/yolo/ – crodriguezo

1

Кажется, что вы на правильном пути, вращение, как правило, очень полезно для увеличения учебных данных. Я бы предложил попробовать другие преобразования, такие как shift (вы, скорее всего, хотите обнаружить частично существующие объекты), масштабирование (делает вашу модель инвариантной по шкале), сдвиг, флип и т. Д. Объединив различные преобразования, вы можете ввести дополнительное разнообразие в своем обучении данные. Тренировочный набор из 300 изображений - очень небольшое число, поэтому вам обязательно понадобится более одной трансформации, чтобы увеличить столь крошечный набор для обучения.

+0

Спасибо, что так хорошо объяснили. Я также включил переводы. –

0

Это хороший подход, если вы не меняете эти метки неявно, когда делаете rotation. Например. Изображение, содержащее цифру 6, станет цифрой 9 при повороте на 180 град. Таким образом, вы должны обратить внимание на такие сценарии.

Но, вы можете также сделать другие геометрические преобразования, как scaling, translation

Другие дополнения, которые можно рассматривать как с помощью заранее подготовленных моделей, таких как ImageNet, если ваш домен проблема имеет некоторое сходство с данными ImageNet. Это позволит вам обучать более глубокие модели даже для вашей ситуации с дефицитом данных.

+1

Благодарим вас за предложения. Я также включил перевод в изображения. –

Смежные вопросы