Особенности распознавания жестов

Я хотел бы создать приложение, которое может научиться классифицировать последовательность точек, нарисованных пользователем, например. что-то вроде распознавания рукописного ввода. Если точка данных состоит из нескольких пар (x, y) (таких как пиксели, соответствующие экземпляру жестов), каковы наилучшие возможности для вычисления экземпляра, который мог бы создать хороший классификатор многоклассов (например, SVM, NN и т. Д.)? В частности, если имеются ограниченные учебные примеры.Особенности распознавания жестов

источник

2012-06-13 genekogan

Это неопределенный и очень открытый вопрос. что ты уже испробовал? Какая производительность вам нужна/ожидаете? Насколько ограничены примеры обучения? Я мог бы дать кучу предложений, но они могут оказаться непригодными. – Junuxx

Число экземпляров будет десятки, возможно 3-5 различных классов. Пользователь интерактивно прослеживает простой жест/форму на 2-й сетке, например. диагональная линия, дуга, зигзаг и т. д. Сырые данные будут состоять из (x, y) пар, прослеживаемых на экране, или, возможно, трехмерной версии с (x, y, z) триплетами. Я рассмотрел вопрос о принятии ограничивающий прямоугольник вокруг жесты, превращая его в изображение (белый фон, черная фигура), понижая его до 6x6 и используя 36 пиксельных значений в качестве функций (или используя PCA, чтобы уменьшить размерность больше). Я подозреваю, что функции более высокого уровня, основанные на кривизне, могут быть лучше? – genekogan

Если бы я был вами, я бы нашел точки данных, соответствующие углам, конечным точкам и пересечениям, использующим их как функции и отбрасывая промежуточные точки. Вы могли бы указать угол или какой-либо другой дескриптор этих точек интереса.

Для определения точек интереса вы можете использовать Harris detector, тогда вы можете использовать значение градиента в этой точке как простой дескриптор. В качестве альтернативы вы можете пойти с более причудливым методом, например SIFT.

Вы можете использовать дескриптор каждого пикселя в изображении с пониженной дискретизацией, а затем классифицировать с помощью SVM. Недостатком этого является то, что в векторе признаков будет большое количество неинтересных точек данных.

Альтернативой было бы не подходить к нему как к проблеме классификации, а как к проблеме с сопоставлением шаблонов (довольно распространенная в computer-vision). В этом случае жест может быть указан как произвольное количество точек интереса, полностью исключая неинтересные данные. Определенный пороговый процент точек экземпляра должен соответствовать шаблону для положительной идентификации. Например, при сопоставлении угловых точек экземпляра «R» с шаблоном для «X» нижняя правая точка должна совпадать, являясь конечными точками в одной и той же ориентации позиции, но другие слишком разнородны, что дает довольно низкую оценка и идентификация R = X будут отклонены.

источник

2012-06-17 12:33:57 Junuxx

Особенности распознавания жестов

ответ

Смежные вопросы