2016-09-13 2 views
0

Я нашел эту удивительную открытую систему распознавания образов с открытым исходным кодом - Pastec, и она отлично поработала так, что я взял видеообъекта и пробовал 10% видеокадров, и он может распознать остальное видео довольно хорошо.Image Feature Extraction - Preprocessing

Однако после того, как я проиндексировал видео и сделал еще одну фотографию в совершенно другой среде, он не смог ее распознать, даже если для меня они выглядят очень похожими.

Нужно ли применять некоторую базовую обработку, такую ​​как пороговое (двоичное), сглаживание и, возможно, контур перед извлечением и индексированием функции? также, если это так, мне, вероятно, также необходимо применить ту же технику перед запросом.

Здесь я беру почти 360-градусное видео продукта и индексирую все кадры в базе данных, надеюсь, что искаженное изображение будет иметь угол, который появился в данных обучения.

enter image description here

В проекте, упомянутые «не предназначен для распознавания лиц, 3D-объекты, штрих-коды или QR-коды.» Я не знаю, если я тратить время здесь с помощью этого программного обеспечения или есть другой подход/инструмент/методы, которые мне нужно принять.

ответ

0

Pastec основан на Visual Words, который, в свою очередь, использует локальный дескриптор, такой как SIFT или SURF. Эти два не являются полностью вращательными инвариантами и, скорее всего, полностью не сработают, если точка обзора отличается.

Разница в освещении будет иметь, очевидно, огромное влияние на способность распознавания. Предварительная обработка может помочь немного, но не так, к сожалению. Я бы использовал статистический или нейронный сетевой подход для такой проблемы.

+0

Просто отметим, что pastec использует ORB; D – Miki

+0

@ Miki хорошо, что может многое объяснить, поскольку SIFT и SURF обычно намного лучше. – CTZStef

+0

yep, но запатентован D – Miki