Я использую сверточные нейронные сети (CNN), и я просто хочу спросить, правильно ли я разделяю мой набор для обучения/проверки/тестирования.Тренировочная проверка Набор тестов для набора данных для выражения лица
У меня есть в общей сложности 55 предметов. Я планирую разбить их на 80-10-10 для обучения (45 предметов), валидацию (невидимые 5 предметов), тестирование (невидимые 6 предметов).
Должен ли набор валидации состоять из невидимых предметов? Или я могу перетасовать весь набор тренировок и использовать его часть (10-20%) в качестве набора валидации?
Я прочитал, что с использованием перекрестной проверки N-Fold весь набор тренировок (экземпляров) перетасовывается, затем разбивается на N-folds, и модель обучается и усредняется N раз. Однако в случае с Neural Networks или CNN мы не используем кросс-валидацию, поскольку она очень дорого вычисляется.
Мне просто интересно, что правильно, так как с помощью набора проверенных невидимых предметов моя модель начинает наматываться после 3-5 эпох и вообще не учится. С другой стороны, если я использую 10-20% набора тренировок в качестве моей проверки, моя модель учится с разумной точностью (45-50%) с использованием трехслойного CNN, но при тестировании с невидимым набором тестов мой Точность top-1 составляет только 15-16%.
спасибо.
Первый вопрос, который вы должны задать себе при разработке CNN, - это если у вас достаточно данных для его подачи. Сколько изображений есть на предмет? Если их меньше 100, я предлагаю найти больше данных о тренировках, это правильный ход. Я бы даже предложил получить более 10 000 учебных образов. –
@ThomasPinetz У меня есть данные 500 КБ. У каждого предмета есть 100 видеоклипов с выражением, поэтому в общей сложности 5500 видеоклипов составляют в среднем около 2-5 секунд. Достаточно данных. Думаю, я спрашиваю, правильно ли раскол. – Renz