ОК, поэтому я использую RMS prop или SGD, чтобы получить нейронную сеть, чтобы узнать ее параметры. Но через некоторое время, как ошибки обучения, так и проверки достоверности, как представляется, застопорились (за пределами случайных колебаний: я использую исключение).Конъюгатный градиент с шумной функцией
Итак, я решил, чтобы попытаться использовать сопряженный градиент, чтобы уточнить значения. Я все еще, очевидно, не хочу, чтобы он набирал обороты, поэтому я держал отсева ... Но, конечно, это делает функцию оптимизации шумной. Итак, я думаю, мой вопрос: имеет ли Conjugate Gradient (или L-BFGS или т. Д.) Бесшумные функции? Или они могут работать при наличии шума?
Спасибо!