Я хотел бы создать приложение, которое может научиться классифицировать последовательность точек, нарисованных пользователем, например. что-то вроде распознавания рукописного ввода. Если точка данных состоит из нескольких пар (x, y) (таких как пиксели, соответствующие экземпляру жестов), каковы наилучшие возможности для вычисления экземпляра, который мог бы создать хороший классификатор многоклассов (например, SVM, NN и т. Д.)? В частности, если имеются ограниченные учебные примеры.Особенности распознавания жестов
ответ
Если бы я был вами, я бы нашел точки данных, соответствующие углам, конечным точкам и пересечениям, использующим их как функции и отбрасывая промежуточные точки. Вы могли бы указать угол или какой-либо другой дескриптор этих точек интереса.
Для определения точек интереса вы можете использовать Harris detector, тогда вы можете использовать значение градиента в этой точке как простой дескриптор. В качестве альтернативы вы можете пойти с более причудливым методом, например SIFT.
Вы можете использовать дескриптор каждого пикселя в изображении с пониженной дискретизацией, а затем классифицировать с помощью SVM. Недостатком этого является то, что в векторе признаков будет большое количество неинтересных точек данных.
Альтернативой было бы не подходить к нему как к проблеме классификации, а как к проблеме с сопоставлением шаблонов (довольно распространенная в computer-vision). В этом случае жест может быть указан как произвольное количество точек интереса, полностью исключая неинтересные данные. Определенный пороговый процент точек экземпляра должен соответствовать шаблону для положительной идентификации. Например, при сопоставлении угловых точек экземпляра «R» с шаблоном для «X» нижняя правая точка должна совпадать, являясь конечными точками в одной и той же ориентации позиции, но другие слишком разнородны, что дает довольно низкую оценка и идентификация R = X будут отклонены.
- 1. Создание домена распознавания жестов
- 2. Проводник распознавания жестов swift
- 3. Потерятор распознавания жестов в UIPopoverController
- 4. добавить звук для распознавания жестов
- 5. Любимая техника распознавания жестов руки
- 6. DTW для распознавания 3D-жестов
- 7. Проводник распознавания жестов не запускается?
- 8. Kinect для распознавания жестов Windows
- 9. Значок распознавания жестов на кнопке
- 10. Признак распознавания жестов с искажениями с помощью распознавателя жестов
- 11. Текущее состояние распознавания жестов в OpenCV?
- 12. Почему признак распознавания жестов только работает?
- 13. Распознаватель распознавания жестов с использованием озвучивания
- 14. Добавить салфетку распознавания жестов в uilabel (swift)
- 15. Устройство распознавания жестов с голосом за активным
- 16. признак распознавания жестов не будет целевым действием
- 17. Длинная проблема распознавания жестов при печати
- 18. Приложение на основе страниц и распознавания жестов
- 19. Длинный рекордер распознавания жестов дважды выстрелил
- 20. Добавить признак распознавания жестов в SKSpriteNode
- 21. Проводник распознавания жестов не может определить направление?
- 22. Лучший алгоритм распознавания жестов для Kinect
- 23. HMM, используя Accord.Net для распознавания жестов
- 24. Как передать номер действию распознавания жестов?
- 25. iOS: распознавание распознавания жестов не работает
- 26. Реализация распознавания жестов в приложении для Android
- 27. Влияние производительности распознавания жестов в Delphi?
- 28. Интерактивная кнопка распознавания распознавания жестов для распознавания знаков touchupinside в пользовательском uitableviewcell
- 29. Haar подготовленный набор данных для распознавания жестов - подсчет
- 30. Передача переменной из функции распознавания жестов в IBAction
Это неопределенный и очень открытый вопрос. что ты уже испробовал? Какая производительность вам нужна/ожидаете? Насколько ограничены примеры обучения? Я мог бы дать кучу предложений, но они могут оказаться непригодными. – Junuxx
Число экземпляров будет десятки, возможно 3-5 различных классов. Пользователь интерактивно прослеживает простой жест/форму на 2-й сетке, например. диагональная линия, дуга, зигзаг и т. д. Сырые данные будут состоять из (x, y) пар, прослеживаемых на экране, или, возможно, трехмерной версии с (x, y, z) триплетами. Я рассмотрел вопрос о принятии ограничивающий прямоугольник вокруг жесты, превращая его в изображение (белый фон, черная фигура), понижая его до 6x6 и используя 36 пиксельных значений в качестве функций (или используя PCA, чтобы уменьшить размерность больше). Я подозреваю, что функции более высокого уровня, основанные на кривизне, могут быть лучше? – genekogan