2016-10-18 3 views
0

Чтобы подготовить большие объемы наборов данных для обучения моделях классификации изображений на основе глубокого обучения, нам обычно приходится полагаться на методы увеличения изображений. Я хотел бы знать, каковы обычные алгоритмы увеличения изображений, есть ли какие-либо соображения при их выборе?алгоритмы увеличения изображения для подготовки набора для глубокого обучения

ответ

1

Литература по увеличению данных очень велика и очень зависит от ваших приложений. Первыми вещами, которые приходят мне на ум, являются повороты соревнований галактики и увеличение данных Джаспера Сноке.

Но на самом деле все документы имеют свои собственные трюки, чтобы получить хорошие оценки на специальных наборах данных для примеров, растягивающих изображение до определенного размера, прежде чем обрезать его или что-то еще, и это в очень определенном порядке.

Более конкретно, чтобы обучать модели на подобных CIFAR или IMAGENET, используйте случайные культуры и случайный контраст, возмущения светимости дополнительно к очевидным сдвигам и добавлению шума.

Посмотрите на учебник CIFAR-10 на веб-сайте TF, это хорошее начало. Плюс TF теперь имеет random_crop_and_resize(), что весьма полезно.

EDIT: Документы, на которые я ссылаюсь here и there.

0

Это зависит от проблемы, которую вы должны решить, но большую часть времени вы можете сделать:

  1. Поворот изображения
  2. Отразить изображение (X или Y симметрии)
  3. Добавить шум
  4. Все предыдущие в то же время.
Смежные вопросы