В слое ввода caffe можно определить среднее изображение, которое содержит средние значения всех используемых изображений. Из примера образа изображения: «Модель требует от нас вычесть среднее значение изображения из каждого изображения, поэтому мы должны вычислить среднее значение».Что делает caffe со средним двоичным файлом?
Мой вопрос: Какова реализация этого вычитания? Является ли это просто:
used_image = original_image - mean_image
или
used_image = mean_image - original_iamge
или
used_image = |original_image - mean_image|^2
, если это один из первых двух, то как отрицательные пиксели handeld? Поскольку изображения обычно хранятся в uint8, это означает, что это просто начинается с самого начала. например
200 - 255 = 56
Почему я должен это знать? Я сделал тесты, и я знаю, что второй пример или третий пример будут работать лучше.
Спасибо, я копал исходный код и только что нашел его (строка 115 в data_transformer.cpp). – Kev1n91
Хорошее слежение - теперь у вас есть знание из первых рук, наряду с другим обучением, собранным на этом пути. – Prune
Я только что обсуждал это: поскольку это сделано на уровне ввода, возможно, этот код уже занимает часть графического процессора, где он все преобразован в float, поэтому это означает, что темный пиксель становится отрицательным числом – Kev1n91