0

Я хотел бы реализовать пакет слов для моего проекта. Я вычислил кодовую книгу визуальных слов изображений, используя их особенности и дескрипторы. Затем я получил центры кластеров, используя k-средства. Для мешка с изображением слов нужно попросить использовать сегменты с маркировкой вручную, представленные как часть набора данных. В наборе данных для каждого изображения есть три разные двоичные маски. Являются ли эти помеченные сегменты бинарными масками? Если да, то как я буду использовать эти вычисленные визуальные слова?Сумка слов Представление

+0

Не видя данных, трудно сказать. Но я думаю, что да, помеченные сегменты - это пиксели, выбранные двоичными масками. Я думаю, что задание хочет, чтобы вы использовали функции скрытых сегментов для обучения визуальным словам, а не раздвижным окном или другим способом выбора сегментов из изображения. – Cecilia

ответ

0

Подход словария обеспечивает краткое представление изображения или части изображения. Это представление обычно используется как вход для алгоритма классификации, который используется для оценки класса, которому принадлежат данные изображения. Как правило, классификатор представляет собой контролируемый метод обучения, который потребует пары (дескриптор, ярлык) от некоторого набора тренировок во время учебного процесса. В вашем случае дескриптор представляет собой представление BOW данных изображения из вашего учебного набора. Затем во время тестирования вы будете подавать BOW-дескриптор новых данных изображения в классификатор, чтобы вывести класс.

Из того, что я понимаю, факт, что у вас есть три разных маски для изображений, означает, что у вас также есть три класса. Затем каждая маска скажет вам, какая часть изображения должна считаться данными изображения, принадлежащими определенному классу. Это ваши данные о тренировках.

В этом предположении вы должны извлечь части изображений, соответствующие каждой маске, вычислить представление BOW для этих частей изображения (отдельно для каждой маски) и использовать их с номером маски в качестве метки для обучения классификатора ,

Это позволит вам позже, например. используйте подход скользящего окна, чтобы классифицировать части тестового изображения как принадлежащие к одному из трех классов, используемых во время обучения. Это был бы простой случай проблемы обнаружения.

Я не уверен, что правильно понял вашу проблему, но я надеюсь, что это поможет вам немного продвинуться вперед.

+0

Я выполнил представление слов для каждой маски с помощью функции в этой ссылке: (http://www.mathworks.com/matlabcentral/fileexchange/43631-compute-bag-of-visual-word-representation-for- a-image) Однако сказано, что у вас должен быть мешок с изображением слов и метка объекта для каждого сегмента. Эта функция вычисляет вектор id и гистограмму для каждой маски. Являются ли эти значения id объектными метками? @Andrzej –