Я новичок в нейронных сетях и понимаю суть их работы. Я намереваюсь создать нейронную сеть, которая распознает базовые объекты в 3d-сцене и их позиции на изображении.Поиск шаблонов/изображений внутри других изображений с помощью нейронных сетей
Из того, что я читал до сих пор, типичный подход заключается в создании нейронной сети с входным числом нейронов изображения_ширина * image_height * 3 (для каждого цвета), а затем назад распространения (базовый пример для распознавания изображений can be found here. Я также читал о более разумных подходах. Проблема в том, что, поскольку я все еще участвую, я намерен сохранить базовый подход, чтобы получить информацию, синхронизированную (которая может или не может быть выполнена с состоянием начинающих).
Как я могу сделать это прямолинейным способом? Реальный проект состоит в том, чтобы перемещаться по сцене и обнаруживать определенные базовые (или не в будущем) объекты, такие как шары.
Это чистая академия так что реальный объем задачи состоит в том, чтобы узнать, что также не учитываются совершенные решения.
Что я хотел бы, чтобы обнаружить мяч в изображении и на самом деле имеют положение шара