1

Хорошо, я начинаю понимать идею нейронных сетей, но я до сих пор не смог понять использование/преимущества/реализацию сверточных нейронных сетей, особенно для обработки изображений.Свертывающие нейронные сети?

Я не понимаю, как определить объект разного размера.

Скажем, у нас есть весовая матрица 50 * 50 и лицо в наборе тренировок размером 50 * 50. Теперь, когда вы берете взвешенную сумму матрицы, она возвращает определенное значение «X». Итак, теперь я понимаю, что идея состоит в том, чтобы запустить матрицу весов по всему изображению, чтобы получить блокировку по области, которая дает взвешенную сумму ~ "X", теперь вы обнаружили лицо.

Если вышеприведенное понимание истинно, тогда как это изображение размером 25 * 25 будет собирать значение в любом месте, клонированном до «X». Итак, основной вопрос - как относиться к относительным размерам изображения.

Если возможно, предложите несколько хороших учебников для них.

ответ

0

Я отправил аналогичный question и ваши выскочил, поэтому пару мыслей, хотя это старый вопрос:

  • обычно у вас есть более одной весовая матрица (т.е. несколько слоев) в нейронной сети , поэтому «получение блокировки по региону» часто слишком упрощается. Особенности, которые являются «важными» для нейронных сетей, могут быть сложными.
  • Одной из основных особенностей сверточных сетей является упрощение и «понижающая дискретизация» весовых матриц (называемых пулами), как указано в ответе на мои аналогичные question.
  • Входы в нейронную сеть для распознавания изображений могут сильно различаться, вам не всегда нужен пиксельно-пиксельный вход. Среди многих из приведенных сокращений вы можете использовать векторы, лежащие над изображением (read more here).
  • Вот link to a good tutorial, что мне было предложено/помогло мне