Я тренирую AlexNet по своим собственным данным, используя кофе. Одна из проблем, которые я вижу, заключается в том, что «Выходная мощность поезда» Потеря и «Итерационные потери» почти одинаковы в процессе обучения. Более того, эта потеря имеет колебания. нравится:Почему потери «потери поезда» и «потери итерации» одинаковы во время обучения с помощью кофе?
... ...Iteration 900, loss 0.649719 ... Train net output #0: loss = 0.649719 (* 1 = 0.649719 loss) ... Iteration 900, lr = 0.001 ...Iteration 1000, loss 0.892498 ... Train net output #0: loss = 0.892498 (* 1 = 0.892498 loss) ... Iteration 1000, lr = 0.001 ...Iteration 1100, loss 0.550938 ... Train net output #0: loss = 0.550944 (* 1 = 0.550944 loss) ... Iteration 1100, lr = 0.001 ...
- я должен увидеть это колебание?
- Как вы видите, разница между сообщаемыми потерями невелика. Является ли это проблемой в моем обучении?
мой solver
является:
net: "/train_val.prototxt"
test_iter: 1999
test_interval: 10441
base_lr: 0.001
lr_policy: "step"
gamma: 0.1
stepsize: 100000
display: 100
max_iter: 208820
momentum: 0.9
weight_decay: 0.0005
snapshot: 10441
snapshot_prefix: "/caffe_alexnet_train"
solver_mode: GPU
относящийся: http://stackoverflow.com/q/31840488/1714410 – Shai