Я использую caffe для глубокого обучения и хочу сделать слой softmaxwithloss python (возможно, это не имеет смысла, но я хочу попробовать). Проблема в том, что мой слой не работает в обратном разделе на этапе обучения (получены данные NAN в данных).о caffe python API
Вопрос в том, как работает кафэ назад для обучения? Каждый слой изучает его diff (caffe.Layer [0] .diff или что-то подобное) и передает его на следующий уровень? Итак, единственное, что нужно сделать, это рассчитать разницу нижнего уровня, которая может сделать обратную работу?
Большое спасибо