7

Я создаю веб-приложение и планирую использовать как speechRecognition, так и navigator.getUserMedia для аудиовхода.Распознавание речи и getUserMedia

Я заметил, что мой настольный браузер (Chrome on Mac, v. 31.0.1650.63) дважды запрашивает разрешение на использование микрофона. Хотя это может быть немного раздражающим для пользователя, как голосовое распознавание, так и аудиовход, похоже, работают.

Однако, если я открою ту же страницу на Android (Nexus 7, Android v4.4.2; Chrome v31.0.1650.59), он дважды попросит разрешения использовать мой микрофон, но я могу использовать только один из двух (в зависимости от того, что было начато первым). Иногда я также получаю ошибку распознавания речи error: "not-allowed", хотя я дал разрешение на доступ к микрофону.

Я сделал jsFiddle здесь: http://jsfiddle.net/5xBpW/

Мой вопрос: Есть ли способ для распознавания речи на входном потоке? Или есть ли другой способ использовать обе функции в Chrome для Android?

+0

Учитывая, что 'getUserMedia' по-прежнему довольно экспериментальный на Android, а' speechRecognition' является экспериментальным во всем мире, это звучит как отличный отчет об ошибке. [Он, похоже, уже не зарегистрирован] (https://code.google.com/p/chromium/issues/list?q=getUserMedia+os%3DAndroid). – apsillers

+1

Я зарегистрировал новую ошибку для этого: https://code.google.com/p/chromium/issues/detail?id=333881 – snorpey

ответ

1

Считаете ли вы другие инструменты? В Nuance появился новый захватывающий инструмент/продукт (основанный Ray K, теперь глава Google Engineering), который преобразует голосовые данные в действия с использованием собственных алгоритмов обучения, например, машинного интеллекта.

Этот инструмент понимает контекст и может применить это к конкретным действиям, так что пользователь не должен использовать точную фразу:

https://developer.nuance.com/public/index.php?task=mix

Тур: https://developer.nuance.com/views/templates/mix/howDoesMixWork/phone/index.html

Недостатком является то, что вы полагаясь на третью сторону, но поскольку API, на который вы смотрите, также является экспериментальным, это может представлять интерес.

Смежные вопросы