У меня есть набор из 10 высококачественных аэрофотоснимков с 10-мегапиксельными изображениями, содержащими информацию об ограничительной коробке каждого транспортного средства (ширина, высота, угол, x & y ось, ...). Это пример:Как создать учебный набор данных для обработки изображений
@CATEGORY:GENERAL
@IMAGE:2012-04-26-Muenchen-Tunnel_4K0G0010.JPG
#format: id type center.x center.y size.width size.height angle
0 30 1319 2338 35 11 56.451578
1 30 1337 2350 42 14 57.817368
2 30 224 3556 61 20 136.967797
Как я должен создать базу данных автомобилей для обучения в нейронной сети с использованием Caffe? Должен ли я использовать photoshop, чтобы обрезать каждое транспортное средство и сохранить их по одному? или можете использовать файлы txt для создания различных классов транспортных средств для обучения в сети с помощью sth, как Matlab?
Если у вас есть только 10 фотографий, вы будете быстрее, выполнив это руководство в фотошопе, но если вы захотите, вы можете использовать библиотеку изображений, чтобы получить эти файлы – Maaaaa
спасибо за ответ. Есть 10 фотографий, но с большим количеством транспортных средств в них. Я говорю тысячи. Должен ли я отделять каждое транспортное средство своими точными границами или просто ограничивать его вокруг? –