Тренировочная проверка Набор тестов для набора данных для выражения лица

Я использую сверточные нейронные сети (CNN), и я просто хочу спросить, правильно ли я разделяю мой набор для обучения/проверки/тестирования.Тренировочная проверка Набор тестов для набора данных для выражения лица

У меня есть в общей сложности 55 предметов. Я планирую разбить их на 80-10-10 для обучения (45 предметов), валидацию (невидимые 5 предметов), тестирование (невидимые 6 предметов).

Должен ли набор валидации состоять из невидимых предметов? Или я могу перетасовать весь набор тренировок и использовать его часть (10-20%) в качестве набора валидации?

Я прочитал, что с использованием перекрестной проверки N-Fold весь набор тренировок (экземпляров) перетасовывается, затем разбивается на N-folds, и модель обучается и усредняется N раз. Однако в случае с Neural Networks или CNN мы не используем кросс-валидацию, поскольку она очень дорого вычисляется.

Мне просто интересно, что правильно, так как с помощью набора проверенных невидимых предметов моя модель начинает наматываться после 3-5 эпох и вообще не учится. С другой стороны, если я использую 10-20% набора тренировок в качестве моей проверки, моя модель учится с разумной точностью (45-50%) с использованием трехслойного CNN, но при тестировании с невидимым набором тестов мой Точность top-1 составляет только 15-16%.

спасибо.

источник

2016-10-03 Renz

Первый вопрос, который вы должны задать себе при разработке CNN, - это если у вас достаточно данных для его подачи. Сколько изображений есть на предмет? Если их меньше 100, я предлагаю найти больше данных о тренировках, это правильный ход. Я бы даже предложил получить более 10 000 учебных образов. –

@ThomasPinetz У меня есть данные 500 КБ. У каждого предмета есть 100 видеоклипов с выражением, поэтому в общей сложности 5500 видеоклипов составляют в среднем около 2-5 секунд. Достаточно данных. Думаю, я спрашиваю, правильно ли раскол. – Renz

В целом, нет правила; есть едва ли правило. Большая часть работы по разработке топологии и модели заключается в настройке гиперпараметров; коэффициент валидации поезда-теста является лишь одним из них. Типичные расщепления очень примерно 2: 1: 1, с большим количеством вариаций, в зависимости от цели и набора данных. Я начинаю подвергать сомнению разделение, если тренировка составляет менее 50%, либо тест или подтверждение составляет менее 20% (хотя иногда полезно 15%, особенно если набор данных слишком мал).

«Правильно» во многом зависит от вашей конечной цели для модели. Если вы ожидаете, что он будет обрабатывать новые предметы, то, конечно, вы должны включить невидимые предметы для тестирования и проверки. Если вам нужно только хорошо различать данные для данной темы, тогда вам понадобится сбалансированный микс, возможно, 45: 10: 0 - в этом случае вы бы добро пожаловать переустановить.

Если вы ожидаете обработки выражений из общего населения (новые предметы), то я считаю, что вам не хватает учебных предметов. Чтобы правильно настроить такую модель, вам нужно достаточно, чтобы вы могли играть с пропорциями, и даже что-то такое же тонкое, как 8: 1: 1, должно дать вам результаты, которые вы можете признать полезными.

источник

2016-10-03 21:08:05 Prune

Привет @Prune большое спасибо за ваш ответ. Я был просвещен, я ничего не знаю о целях моделей, может быть, я должен спросить моего советника об этом. Однако, это опечатка? «Если вам нужно только хорошо различать данные предметы, тогда вам понадобится сбалансированный микс, возможно ** 45: 10: 0 ** - в этом случае вы приветствуете чрезмерную установку». 45% для обучения, 10% для проверки и 45% для тестирования? – Renz

Извините; это 45 предметов для 10 предметов. Для проверки вы можете использовать весь набор ввода 55. – Prune

Большое спасибо, я пробовал создать модель для различения хорошо для данных предметов (а не для модели для обработки новых предметов), я не думаю, что я переутомил, потому что после обучения моя точность по всем валидационным данным (10%) составляет около 50%, а на графике - около 70-75% с размером партии 256. Я делаю это правильно? Кроме того, мне просто интересно, почему я должен использовать весь набор входных данных 55 как проверку после обучения модели? – Renz

Тренировочная проверка Набор тестов для набора данных для выражения лица

ответ

Смежные вопросы