2016-11-05 2 views
0

У меня есть набор из 10 высококачественных аэрофотоснимков с 10-мегапиксельными изображениями, содержащими информацию об ограничительной коробке каждого транспортного средства (ширина, высота, угол, x & y ось, ...). Это пример:Как создать учебный набор данных для обработки изображений

@CATEGORY:GENERAL 

@IMAGE:2012-04-26-Muenchen-Tunnel_4K0G0010.JPG 

#format: id type center.x center.y size.width size.height angle 

0 30 1319 2338 35 11 56.451578 

1 30 1337 2350 42 14 57.817368 

2 30 224 3556 61 20 136.967797 

Как я должен создать базу данных автомобилей для обучения в нейронной сети с использованием Caffe? Должен ли я использовать photoshop, чтобы обрезать каждое транспортное средство и сохранить их по одному? или можете использовать файлы txt для создания различных классов транспортных средств для обучения в сети с помощью sth, как Matlab?

+0

Если у вас есть только 10 фотографий, вы будете быстрее, выполнив это руководство в фотошопе, но если вы захотите, вы можете использовать библиотеку изображений, чтобы получить эти файлы – Maaaaa

+0

спасибо за ответ. Есть 10 фотографий, но с большим количеством транспортных средств в них. Я говорю тысячи. Должен ли я отделять каждое транспортное средство своими точными границами или просто ограничивать его вокруг? –

ответ

0

С этим множеством транспортных средств я не стал бы это делать вручную. В python вы можете загрузить изображение в массив numpy, а затем выбрать поля с данными, содержащимися в файлах. Вы можете обрабатывать углы, вращая весь массив, а затем выбирайте поле так же, как вы выбираете «нормальный».

Если вы используете другой язык программирования, вы должны следовать этому подходу, вам просто нужно преобразовать jpeg в растровое изображение и каким-то образом передать его в массив.

Я не знаю Caffe, но обычно требуется фиксировать точные bounderies, потому что нейронной сети нужны коробки того же размера.

Смежные вопросы