Я построил систему, в которой нейронная сеть может изменять размер (количество и размер скрытых слоев и т. Д.). При обучении с уровнем обучения 0,5, 1 скрытым слоем из 4 нейронов, 2 входами и 1 выходом, он успешно изучает проблему XOR и AND (двоичные входы и т. Д.). Работает очень хорошо.Как определить проблему с нейронными сетями
Когда я затем создаю входы структуры 784, 1 скрытый слой из 30 нейронов и 10 выходов и применяю набор цифр MNIST, где каждый вход является значением пикселя, я просто не могу получить хорошие результаты (не лучше, чем случайные !). Мой вопрос основан на теории: если мой код действительно работает с другими проблемами, я должен предположить, что мне нужно продолжать экспериментировать с разными уровнями обучения, скрытыми слоями и т. Д. Для этого? Или нужно решить, что это более основная проблема?
Как найти правильную комбинацию слоев, скорость обучения и т. Д.? Как бы вы это сделали?
Тестирование также трудно, как это занимает около 2 часов, чтобы добраться до точки, где он должен был узнать ... (на макинтош)
Нет, я не использую TensorFlow или другие библиотеки, потому что я я бросаю вызов себе. В любом случае, он работает ... до предела!
Большое спасибо. И приношу извинения за слегка абстрактный вопрос, но я знаю, что это проблема многих новичков, поэтому я надеюсь, что это тоже поможет другим.