Я работаю над проектом, который заключается в локализации объекта в изображении. Метод, который я собираюсь принять, основан на алгоритме локализации в CS231n-8.Как свести к минимуму две потери с помощью TensorFlow?
Структура сети имеет две головки оптимизации, головку классификации и регрессионную головку. Как я могу свести их к минимуму при обучении сети?
У меня есть одна идея, которая суммирует оба из них в одну потерю. Но проблема заключается в потере классификации: потеря softmax и потеря регрессии - потеря l2, что означает, что они имеют различный диапазон. Я не думаю, что это лучший способ.
Отлично! Спасибо за Ваш ответ. Могу ли я задать еще один вопрос, как представить класс «фона» при обучении регрессионной головы? Я использую нули сейчас. Есть ли способ лучше? –
Вы тренируете регрессионную головку: вам не нужен класс фона. Ваш набор поездов содержит положение ограничивающей рамки объекта, поэтому вы научитесь регрессировать эти координаты и ничего больше. Фон - это все, что находится за пределами этих координат. Я использую класс фона только в головке классификации, который не используется во время обучения (я показываю только изображения, содержащие объект), но используется, когда сеть запускается в режиме локализации. Если я предскажу некоторые координаты с головой регрессии, но глава классификации говорит мне, что это фон, я пропускаю местоположение – nessuno
Это имеет смысл. Спасибо. –