2012-06-20 3 views
0

В настоящее время у меня есть мобильное приложение, которое может записывать речь как WAV или MP3 и хотело бы преобразовать его в текст. Я огляделся - Microsoft Speech, UCMA и т. Д., Но не видел хороших примеров того, как это сделать. Может кто-нибудь помочь здесь?Mp3/Wav to Text

FYI - У нас есть доступ к MS Lync.

Порадуйтесь любые ответы, Джеймс

ответ

0

Там приведен пример использования SDK UCMA 3.0 для распознавания речи, доступна here. Однако, по опыту (и я очень хочу, чтобы здесь было не так), вы можете узнать только конкретный ответ от заранее определенного набора параметров. Итак, вы можете спросить «Как прошел ваш день» и сообщить UCMA, что действительные ответы «Хорошие», «Ярмарка», «Плохо» и затем попытаются сопоставить любой из них. Я не видел, чтобы он мог «просто» преобразовать свободную речь. (гораздо сложнее)

Это может быть что-то, что Microsoft Speech API может улучшить. Попробуйте this post для начала.