я в настоящее время пытается придумать с новой структурой для CLDNN (Сверточное, LSTM, Deep Neural Network)Оптимизировать гиперпараметры для глубокой сети
Так же, как любой другой сети, я имею трудное время оптимизации гипер- параметры.
Я хотел бы попробовать поиск сетки и случайный поиск, чтобы получить оптимальный набор гиперпараметров, но я не совсем понимаю некоторые вещи.
Если я запускаю моделирование сети с временным набором гиперпараметров, как измерить «Совершенство» гиперпараметров? Я думал о записи стоимости и точности обучения после N числа эпох для каждого моделирования.
Поскольку каждая симуляция занимает относительно много времени (для моей сети требуется около 70 секунд для обучения в течение одной эпохи), существует ли более быстрый способ проверить «доброту» гиперпараметров без фактического прохождения полного обучения?
Есть ли общий совет/советы по оптимизации гиперпараметров?
Благодарим за подробный ответ! Я предполагаю, что нет ярлыка вокруг гипероптимизации? Возможно, мне придется запустить оптимизацию на целую неделю. –