ответ

2

Это слишком широкий вопрос.

В общем, вы можете использовать любые clustering mechanism, например. популярное k-средство. Чтобы подготовить данные для кластеризации, вам нужно преобразовать свою коллекцию в массив X, где каждая строка является одним примером (изображение), и каждый столбец является функцией.

Главный вопрос - какими должны быть ваши функции. Трудно ответить, не зная, чего вы пытаетесь достичь. Если ваши изображения маленькие и имеют одинаковый размер, вы можете просто использовать каждый пиксель в качестве функции. Если у вас есть какие-либо метаданные и вы хотите сортировать их, вы можете использовать каждый тег в метаданных как функцию.

Теперь, если вам действительно нужно найти некоторые шаблоны между изображениями, вам потребуется применить дополнительный уровень обработки, например convolutional neural network, который по существу позволяет вам извлекать объекты из разных частей вашего изображения. Вы можете подумать об этом как о фильтре, который преобразует каждое изображение в, скажем, матрицу 8x8, которая затем может быть использована как строка с 64 различными функциями в вашем массиве X для кластеризации.

+0

Я хочу, чтобы каждый кластер состоял из фотографий одного и того же объекта/сцены, т. Е. Я сделал три фотографии своей комнаты, но из немного другой позиции или на фотографии было меньше света. Таким образом, фотографии не полностью равны, но очень похожи. – alex

+0

В этом случае я сначала попробую простой подход, прежде чем углубиться в глубины глубокого обучения (convnet). Я бы просто извлек карту пикселей из каждого изображения, тем более, что все они имеют одинаковый размер. Преобразование фотографий в черный/белый поможет вам уменьшить сложность. Затем попробуйте применить k-средство от scikit-learn. Измените количество кластеров, чтобы увидеть эффект. Но, скорее всего, вам придется применить какой-то конвейн для получения значимого результата. Я просто предлагаю двигаться поэтапно. – omdv

+0

На самом деле я бы предложил взглянуть на библиотеку mahotas, которая может быть применима в вашем случае. Ссылка - http://mahotas.readthedocs.io/en/latest/features.html – omdv