2010-10-26 2 views
0

Как реализовать распознавание речи через интерфейс веб-браузера.Распознавание речи в веб-браузере

Возможно ли реализовать это без использования какого-либо потокового сервера (полностью браузерного приложения)? Не создавая каких-либо собственных плагинов, можно ли реализовать распознавание речи с помощью Flash ...

ответ

2

Я не верю, что есть поддержка HTML для аудиозахвата. Существует рабочая группа, которая выпустила http://www.w3.org/TR/xhtml+voice/, но я не верю, что это реализовано в любом браузере, кроме Opera (см. http://dev.opera.com/articles/voice/).

Вы можете посмотреть набор инструментов WAMI. Инструмент WAMI - интересный проект от MIT - http://wami.csail.mit.edu/. По их собственным словам «WAMI: веб-доступные мультимодальные приложения. WAMI - это простой способ добавить возможности распознавания речи на любую веб-страницу». WAMI предоставляет вам java-апплет, который может запускаться на вашей веб-странице для выполнения захвата звука для распознавания речи. В своих примерах распознавание выполняется на сервере.

Я подозреваю, что в браузере можно использовать Flash, ActiveX или Java и выполнять локальное распознавание речи с вашей веб-страницы. Однако вам потребуется установить механизм распознавания (или проверить, что он доступен).

0

Я не думаю, что это возможно; используя Flash, вы, конечно же, можете захватывать звук с микрофона пользователя, но на данный момент за пределами WebKit ничего не предлагает распознавание на уровне браузера.

Примечание стороны:

Прямо сейчас, как часть спецификации HTML5, есть x-webkit-speech атрибут можно прикрепить на к <input> элемента - вы могли видеть это в действии в Google Translate. Кажется, это лучший вариант, отличный от Flash.

Я нашел http://caniuse.com/#feat=audio-api, чтобы отслеживать, что возможно, где от this comment по закрытому вопросу.

0

pocketsphinx работает, но недостаточно, чтобы обрабатывать несколько слов, а точность невелика. CSharp отлично, но его не просто развернуть на веб-странице. Для хороших служб требуются удаленные серверы (Bing API, Google API и т. Д.).

Смежные вопросы