2012-12-25 2 views
0

У меня есть немного странный вопрос. Я снимал обнаженную фотографию каждую неделю с тех пор, как начал ходить в спортзал около 6 месяцев назад, и я хочу посмотреть, как я изменился в видео. Проблема в том, что я не сделал их перед синей стеной или что-то в этом роде, но только в моей комнате. Теперь я хочу извлечь из него и создать из него видео. Я мог бы сделать это вручную, но это было бы большой работой, и это было бы не так весело. Есть несколько проблем:Сегментация изображения для нескольких похожих изображений

  • Комната выглядит похоже, но не все в фоновом режиме точно так же всегда
  • Освещение комнаты очень разные
  • Освещение себе отличается
  • Место, где я снимал фотографии, почти то же самое (я старался изо всех сил), но не совсем, поэтому все смещение по-разному на несколько пикселей на каждой фотографии
  • Угол также немного отличается

Я хочу, чтобы иметь возможность извлекать меня из каждой фотографии и автоматически регулировать освещение, чтобы оно выглядело как можно более похоже.

Я знаю алгоритм, который работает для аналогичной проблемы: у меня есть видео только для фона и одного видео, где человек идет по сцене. Затем я могу вычислить средний вектор RGB каждого пикселя в фоновом режиме и построить ковариационную матрицу C и для реального видео, я извлекаю каждый пиксель x, где (x-m) 'C (x-m) больше некоторого порогового значения. Но я думаю, что это работает, если освещение фона слегка меняется, но я думаю, что это не работает для разных углов и разных перемещений, поэтому, я думаю, мне нужно улучшение.

У меня очень хорошие навыки программирования и базовые знания об обработке изображений, поэтому я, вероятно, могу понять документы по теме и т. Д. Я просто не знаю, что искать.

ответ

1

Задача сегментации изображения, в которой пиксели могут принадлежать двум классам, объекту и фону, обычно называется «порогом». Доступно несколько алгоритмов, но почти каждая библиотека обработки изображений реализует метод Otsu (http://en.wikipedia.org/wiki/Otsu%27s_Method) по умолчанию. Если есть неравномерная молния, вы можете попробовать класс алгоритмов, которые используют несколько пороговых значений, по одному для каждого подмножества пикселей на изображении, а не только для всего изображения. Эти методы известны как «адаптивное пороговое значение»/«местное пороговое значение» в литературе и вышли из OCR и медицинских исследований. Возможно, вам придется предварительно обработать/опубликовать результаты с помощью некоторых морфологических фильтров для устранения шума.

Вот отличный блог о подобной задаче сегментации, в MATLAB: http://blogs.mathworks.com/steve/2010/10/08/the-two-amigos/

Если вы все еще не получить хорошие результаты, поиск литературы для «вычитания фона» для более сложных алгоритмов, которые не основаны на пороговые значения интенсивности.

Смежные вопросы