Я тестирую печатные цифры (0-9) на сверточной нейронной сети. Это дает 99% -ную точность в наборе данных MNIST, но когда я попробовал его с помощью шрифтов, установленных на компьютере (Ariel, Calibri, Cambria, Cambria math, Times New Roman) и обучил изображения, созданные шрифтами (104 изображения на шрифт (Total 25 шрифтов -.? 4 изображений на шрифт (немного разница)) частота ошибок обучения не опускается ниже 80%, то есть точность 20% почемуРаспознавание цифр на CNN
Вот образец "2" номер изображения -
Я изменил размер каждого изображения 28 x 28.
Подробнее: -
Данные для обучения размером 28 x 28 изображений. параметры сети - Как LeNet5 Архитектура сети -
Input Layer -28x28
| Convolutional Layer - (Relu Activation);
| Pooling Layer - (Tanh Activation)
| Convolutional Layer - (Relu Activation)
| Local Layer(120 neurons) - (Relu)
| Fully Connected (Softmax Activation, 10 outputs)
Это работает, давая точность 99 +% на MNIST. Почему так плохо с компьютерными шрифтами? CNN может обрабатывать множество вариаций в данных.
Какая полная топология вы используете? Это оригинальный LeNet5, или вы изменили какой-либо скрытый слой? Если вы тренируете новую модель с нуля, переобучение должно выглядеть как еще 99% успеха; ваши 20% предлагают совершенно другую проблему. – Prune
Да, это оригинальный LeNet5, Слои, как упоминалось выше, он работает с набором данных MNIST, но не с моим набором данных. Размер моего набора данных - 1036 изображений, 104 на число. – kumar030