Есть ли у кого-нибудь опыт программирования распознавания голоса на C++ (Windows и/или Mac) для ограниченного количества команд, предназначенных для SPEED? Насколько реалистично на данный момент добиться распознавания команды из первого слога, т. Е. Команда распознается временем, когда пользователь получает второй слог при достаточно быстром темпе речи? Все команды будут запрограммированы на запуск с другим слогом, если необходимо, радикально отличающимся (например, «oo», «xy», «fay» - потребуется только около 30 команд). Аналогичные вопросы заданы, но это быстро движущееся поле. Будет ли лучшая идея искать библиотеки с открытым исходным кодом или взаимодействовать с компилируемыми реализациями?Быстрое распознавание голоса для ограниченного количества команд
ответ
Я профессионально работаю в этой области, и я серьезно сомневаюсь, возможно ли это вообще. C++ не проблема, вопрос в том, разрешает ли компьютер. Частота ошибок на небольших аудиоклипах велика, это скрытая марковская модель, которая фиксирует распознавание. Но в вашем случае вы просто не можете прокормить его достаточными данными.
Не то, чтобы люди могли это сделать. Обработка речи происходит не так быстро, как ваш мозг заставляет вас поверить.
Вот почему я думал об использовании команд с очень характерными звуками, используя только небольшой набор слогов, которые максимально контрастируют друг с другом. Даже кошка может сразу же распознать «ш». – user3101050
Вы можете сделать это с помощью CMUSphinx с декодером Pocketsphinx.
Частичная гипотеза декодирования доступна во время процесса распознавания, и вы можете обычно получить первый слог, как только он будет произнесен. Если вы дадите 0.1s для стабилизации (не видно для пользователя), вы получите точные результаты в наборе команд.
В верхней части CMUSphinx предусмотрены даже инструменты, специально предназначенные для управления в реальном времени, например, в играх, вы можете проверить InProTK и их демонстрации.
Быстрее, чем с помощью Windows SAPI? Меня не интересуют мобильные приложения, только ПК с большим количеством вычислительной мощности. Этот «написанный на Java» для CMUSphinx немного отбросил меня, я уверен, что он может быть достаточно быстрым, но не будет ли родной Microsoft API быстрее? – user3101050
Pocketsphinx - это C-декодер, и он доступен просто из C++. Подробнее см. Http://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx. Вы неправильно читаете о Java. –
- 1. Быстрое распознавание голоса изнутри onActivityResult в Android
- 2. Android-распознавание голоса
- 3. распознавание голоса поезда
- 4. распознавание голоса для Android-приложения
- 5. Повторите последовательность команд в bash для ограниченного количества раз
- 6. распознавание голоса в iPhone
- 7. распознавание голоса в android
- 8. Android-распознавание голоса с помощью простых команд/словарного запаса
- 9. Распознавание голоса и локализация?
- 10. Распознавание голоса: управление голосом
- 11. Java распознавание голоса
- 12. Распознавание голоса в Python
- 13. Простое распознавание голоса Swift?
- 14. распознавание голоса и запись
- 15. Распознавание голоса в Android
- 16. Распознавание голоса в J2ME
- 17. Распознавание голоса в Windows
- 18. Google Voice распознавание голоса
- 19. Распознавание голоса в C#
- 20. Android распознавание голоса?
- 21. Распознавание голоса в .NET
- 22. Распознавание голоса в iPhone?
- 23. человек распознавание голоса/признание
- 24. Android распознавание голоса. Возможности? Надежная?
- 25. Android распознавание голоса API офлайн
- 26. Android - распознавание голоса вместо речи
- 27. Распознавание голоса с помощью аудиофайла?
- 28. Распознавание голоса в фоновом режиме
- 29. Как реализовать распознавание голоса для запуска приложения?
- 30. Google распознавание голоса для поиска текста Проблема
* «Вопросы, предлагающие нам рекомендовать или находить инструмент, библиотеку или любимый внешний ресурс вне темы для переполнения стека, поскольку они, как правило, привлекают упрямые ответы и спам. Вместо этого опишите проблему и то, что было сделано чтобы решить ее ». * – Manu343726
Он не просит помощи в выборе библиотеки, он задается вопросом, достаточно ли зрелое поле, чтобы библиотеки существовали в первую очередь. НЕ вне темы, +1. – MSalters