Изображение кластеризации по его сходству в python

У меня есть коллекция фотографий, и я хотел бы выделить кластеры подобных фотографий. Какие функции изображения и какой алгоритм я должен использовать для решения моей задачи?Изображение кластеризации по его сходству в python

источник

2016-08-24 alex

Это слишком широкий вопрос.

В общем, вы можете использовать любые clustering mechanism, например. популярное k-средство. Чтобы подготовить данные для кластеризации, вам нужно преобразовать свою коллекцию в массив X, где каждая строка является одним примером (изображение), и каждый столбец является функцией.

Главный вопрос - какими должны быть ваши функции. Трудно ответить, не зная, чего вы пытаетесь достичь. Если ваши изображения маленькие и имеют одинаковый размер, вы можете просто использовать каждый пиксель в качестве функции. Если у вас есть какие-либо метаданные и вы хотите сортировать их, вы можете использовать каждый тег в метаданных как функцию.

Теперь, если вам действительно нужно найти некоторые шаблоны между изображениями, вам потребуется применить дополнительный уровень обработки, например convolutional neural network, который по существу позволяет вам извлекать объекты из разных частей вашего изображения. Вы можете подумать об этом как о фильтре, который преобразует каждое изображение в, скажем, матрицу 8x8, которая затем может быть использована как строка с 64 различными функциями в вашем массиве X для кластеризации.

источник

2016-08-24 13:09:31 omdv

Я хочу, чтобы каждый кластер состоял из фотографий одного и того же объекта/сцены, т. Е. Я сделал три фотографии своей комнаты, но из немного другой позиции или на фотографии было меньше света. Таким образом, фотографии не полностью равны, но очень похожи. – alex

В этом случае я сначала попробую простой подход, прежде чем углубиться в глубины глубокого обучения (convnet). Я бы просто извлек карту пикселей из каждого изображения, тем более, что все они имеют одинаковый размер. Преобразование фотографий в черный/белый поможет вам уменьшить сложность. Затем попробуйте применить k-средство от scikit-learn. Измените количество кластеров, чтобы увидеть эффект. Но, скорее всего, вам придется применить какой-то конвейн для получения значимого результата. Я просто предлагаю двигаться поэтапно. – omdv

На самом деле я бы предложил взглянуть на библиотеку mahotas, которая может быть применима в вашем случае. Ссылка - http://mahotas.readthedocs.io/en/latest/features.html – omdv

Изображение кластеризации по его сходству в python

ответ

Смежные вопросы