1

Я тренирую нервную сеть, чтобы распознать три разных знака (знак остановки, знак без знака и знак отсутствия). Я взял 50 изображений для каждого класса. Каждое изображение имеет размер матрицы 8x8, поэтому мой вход будет матрицей 150x64 и выводом - матрицей 3x1, но как назначить цель для этих изображений, также мне нужно нормализовать эти изображения, прежде чем приступать к учебной части?Как установить целевой вектор для обучения изображений в нейронной сети?

+1

Эта проблема очень похожа на проблему распознавания рукописного разряда (MNIST), где ввод также является изображением и выходом 10 различных категорий. Есть много документации и документов о проблеме MNIST, поэтому я бы рекомендовал ее запустить, понять, что они делают, и адаптировать ее к вашей проблеме. [http://yann.lecun.com/exdb/mnist/](http://yann.lecun.com/exdb/mnist/) –

+0

Почему ваш ввод формы 150x64? –

+0

, потому что я принял 50 изображений каждого из трех разных знаков, и все они изменены до 8x8 пикселей. – user48951

ответ

0

Если у изображений нет ярлыков (целей), вы сами должны их наклеить. Маркировка 50 изображений не займет много времени.

Также вы должны каким-либо образом нормализовать изображения, либо min-max, либо вычесть среднее значение и делить на стандартное отклонение, обучение нейронной сети потерпит неудачу, если вы этого не сделаете.

+1

Не получится? Не может провалиться? –

+0

@ MarcinMożejko Очень вероятно, что он потерпит неудачу. Следует подчеркнуть, что нормализация - это позитивная вещь. –

Смежные вопросы