2016-02-09 2 views

ответ

2

Я считаю, что вы имеете в виду схему расширения данных ImageNet Classification with Deep Convolutional Neural Networks. 2048x аспект их схемы дополнения данных происходит следующим образом:

  1. Первые все изображения масштабируются до 256x256
  2. Тогда для каждого изображения они принимают случайные 224x224 размера урожая.
  3. Для каждого случайного урожая 224x224 они дополнительно увеличиваются, принимая горизонтальные отражения этих 224x224 патчей.

Так что я думаю о том, как они получают фактор дополнения данных 2048x:

  1. Есть 32 * 32 = 1024 возможных 224x224 размера изображений посевов 256x256 изображений. Чтобы убедиться в этом, просто наблюдайте, что 256-224 = 32, поэтому мы имеем 32 возможных горизонтальных индекса и 32 возможных вертикальных индекса для наших культур.
  2. Выполнение горизонтальных отражений каждой культуры удваивает размер.
  3. 1024 * 2 = 2048.

Центр культур аспект вашего вопроса проистекает из того факта, что исходные изображения не все одинакового размера. Итак, что сделали авторы, они масштабировали каждый прямоугольный образ так, чтобы самая короткая сторона теперь имела размер 256, и они взяли центральную обрезку из этого, тем самым перемасштабируя весь набор данных до 256x256. После того как они перескажут все изображения до 256x256, они смогут выполнить описанную выше (до) -2048x схему увеличения данных.

Смежные вопросы