Я проходил обучение Microsft Python CNTK для версии 2 Beta 9.0. Я не нашел хорошую документацию с примерами рекомендуемых значений, которые можно передать другим учащимся. Я был в состоянии получить следующие учащиеся, работающие на CNTK 103: Часть B - Feed Forward сеть с MNIST toturial:Примеры для учеников CNTK
lr_per_minibatch=learning_rate_schedule(0.2, UnitType.minibatch)
trainer = Trainer(z, ce, pe, sgd(z.parameters, lr=lr_per_minibatch))
lr_per_minibatch=learning_rate_schedule(0.2, UnitType.minibatch)
trainer = Trainer(z, ce, pe, adagrad(z.parameters, lr=lr_per_minibatch))
lr_per_minibatch=learning_rate_schedule(0.05, UnitType.minibatch)
trainer = Trainer(z, ce, pe, adam_sgd(z.parameters, lr=lr_per_minibatch, momentum=momentum_as_time_constant_schedule(700)))
lr_per_minibatch=learning_rate_schedule(0.2, UnitType.minibatch)
trainer = Trainer(z, ce, pe, nesterov(z.parameters, lr=lr_per_minibatch, momentum=momentum_as_time_constant_schedule(700)))
lr_per_minibatch=learning_rate_schedule(0.1, UnitType.minibatch)
trainer = Trainer(z, ce, pe, rmsprop(z.parameters, lr=lr_per_minibatch, gamma=0.90, inc=0.03, dec=0.03, max=0.1, min=0.1))
Эти работы, но кто-нибудь есть хорошие примеры рекомендуемых значений параметров, каждый тренер получает?
Есть ли у вас какие-либо конкретные рекомендации по скорости обучения и импульсу при использовании оптимизатора adam_sgd? –
Нет, но я работаю над тренером, у которого нет параметров настройки. –
Звучит здорово. Я бы порекомендовал что-то еще. У меня есть опыт работы с анализом конечных элементов CFD. Иногда было полезно начать расчеты с помощью одной модели или решателя, которые с самого начала сходились быстрее; а затем на полпути через симуляцию, измените на другую, которая была лучше или точнее для последующих этапов моделирования. –