1

Я новичок в нейронных сетях и понимаю суть их работы. Я намереваюсь создать нейронную сеть, которая распознает базовые объекты в 3d-сцене и их позиции на изображении.Поиск шаблонов/изображений внутри других изображений с помощью нейронных сетей

Из того, что я читал до сих пор, типичный подход заключается в создании нейронной сети с входным числом нейронов изображения_ширина * image_height * 3 (для каждого цвета), а затем назад распространения (базовый пример для распознавания изображений can be found here. Я также читал о более разумных подходах. Проблема в том, что, поскольку я все еще участвую, я намерен сохранить базовый подход, чтобы получить информацию, синхронизированную (которая может или не может быть выполнена с состоянием начинающих).

Как я могу сделать это прямолинейным способом? Реальный проект состоит в том, чтобы перемещаться по сцене и обнаруживать определенные базовые (или не в будущем) объекты, такие как шары.

Это чистая академия так что реальный объем задачи состоит в том, чтобы узнать, что также не учитываются совершенные решения.

ball in view


Что я хотел бы, чтобы обнаружить мяч в изображении и на самом деле имеют положение шара


ответ

3

Вот хороший URL для вас , вы могли бы прочитать о решении аналогичной задачи (определение точек лицевого ключа в изображениях с использованием DNN): http://danielnouri.org/notes/2014/12/17/using-convolutional-neural-nets-to-detect-facial-keypoints-tutorial/

Короткий рассказ: 1) Это задача регрессии. Вам нужно создать и обучить ANN, который выведет координаты x, y интересующего вас объекта 2) Для достижения этой цели вам необходимо использовать сверточные нейронные сети - они значительно повышают эффективность работы с изображениями.

1

Обычно, не нужно использовать цвета объекта для его обнаружения, и это просто добавляет дополнительную сложность. Вот почему обычно изображение в оттенках серого используется для обнаружения/классификации объектов в основном.

Вы можете использовать подход deep reinforcement learning для обучения искусственным нейронным сетям (ANN) с помощью комбинации обычных и полностью подключенных ANN для определения и объектива .

В качестве альтернативы я могу предложить вам использовать сканирование изображения с прямоугольником, а затем у вас будет не только обнаружение, но и положение прямоугольника.

Кроме того, вы можете использовать другие методы для обучения ИНС, как method, который я использую в настоящее время для задачи обнаружения дефектов ткани, а также была протестирована задача распознавания лица

В факт, комбинация методов дает лучший результат, чем использование единого подхода.

В моем случае с задачей обнаружения ошибок в ткани, используя оба вышеупомянутых (кластеры ANN и окно сканирования с перекрытием) для конкретного случая, это дает мне 0.1024% вероятность ложного обнаружения ошибки и 15% для не обнаружение ошибки для всего изображения.

И с использованием комбинации с Gaussian filter, в добавлении мы достигли менее 0.Вероятность ложного обнаружения на 0324% и менее 5% для не обнаружения, а также производительности была увеличена более чем в 10 раз.

Ниже приведена статья link с подробным описанием подходов, которые я использую для обнаружения дефектов ткани

Смежные вопросы