2016-09-19 11 views
0

Допустим, у меня есть система машинного обучения, которая научилась определять, содержит ли изображение объект (например, автомобиль).Обучение машинам и изображения разных размеров

Вопрос: что делать, когда система получает изображения разных размеров? обучающий набор, например, может состоять из изображений размером 1000x700 px, но реальный мир не настолько однородный, и можно ожидать изображений для 700x1000, 700x400 ...

Первым импульсом будет изменение размера изображения, чтобы иметь того же размера, что и набор для обучения, но он чувствует себя грязным и не очень полезным.

Я пропустил что-то очевидное здесь? Кроме того, даже для набора тренировок я предполагаю, что на самом деле не имеет смысла предполагать, что каждое изображение будет иметь фиксированный размер (опять же, допустим, 1000x700 px).

Кроме того, если вы используете технику скользящего окна, может возникнуть одна и та же проблема, так как определить размер окна можно не просто.

Я предполагаю, что это должна быть относительно общая проблема, поэтому должен быть набор общих решений для нее, любые идеи?

ответ

1

Да. Общие решения:

  1. Изменение размера и обрезки - уменьшите или увеличьте изображение до тех пор, пока оба размера не станут, по крайней мере, желательными. Затем обрезайте фотографию до общего размера.
  2. Обрезка - извлеките урожай обычного размера, при необходимости добавьте.

Теперь ... обрезка обычно выполняется с помощью серии обрезанных фотографий: все четыре угла и центр. В (1) выше было бы всего три изображения, а не 5.

+0

Как насчет размера раздвижных окон? –

+1

Метод с четырьмя углами - это вырожденная версия раздвижных окон. Вы по-прежнему сохраняете окна до нужного размера. Раздвижные окна хороши, когда оригинал значительно больше (не менее 2x), чем желаемый размер, и имеет полезные функции во всех областях. – Prune