Я использую mxnet для обучения классификатору изображений 11 классов. Я наблюдаю за странным поведением, точность обучения постепенно возрастала и достигла 39%, а в следующую эпоху она снизилась до 9%, а затем осталась на уровне 9% для отдыха. Я перезапустил тренировку с сохраненной моделью (с точностью тренировки 39%), сохраняя при этом все остальные параметры. Теперь точность обучения снова увеличивается. Что может быть причиной здесь? Я не могу это понять. И его трудно тренировать модель таким образом, так как она требует от меня постоянно видеть значения точности обучения.Внезапное падение точности при тренировке глубокой нейронной сети
скорость обучения является постоянной на уровне 0,01
Скорее всего, ваша скорость обучения слишком высока, и модель прыгает. Трудно сказать, не зная ваших гиперпараметров – fabrizioM
учебная скорость в 0.01 – sau
Как-то у меня была аналогичная проблема, когда случайно я установил линейную активацию и использовал категориальную кросс-энтропию как функцию стоимости. –