2012-03-13 2 views
0

Я записал свой голос в Matlab. Теперь я хочу преобразовать этот звук в строки i-e; Письменные предложения в Матлабе. Есть ли способ конвертировать аудио в текст.tlab Преобразование аудио

+0

Это ОЧЕНЬ жесткая проблема - даже самые современные алгоритмы не могут этого сделать. Это не место. –

ответ

0

Я уверен, что у MATLAB нет встроенной функции «речь-текст».

Быстрый поиск в Google показал хотя бы один проект, интегрирующий речь в текст в MATLAB.

http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html

Некоторые другие программы, которые могут переводить записанные речи в тексте от Microsoft SAPI (встроенный в Windows Vista и Windows 7, и доступен для загрузки для Windows XP), и CMU's Sphinx проект. Nuance Dragon Naturally Speaking - вариант, но он сравнительно дорогой. Для меня не очевидно, как это можно было бы интегрировать в MATLAB.

0

Вы можете достичь небольшого предела пробега, используя встроенный интерфейс Windows Speech API. Это зависит от вашей системы и т.д. операционной, и вы должны следовать тем же принципам из документации API: http://msdn.microsoft.com/en-us/library/ms723627(v=vs.85).aspx

Использование сервера MATLAB в ACTIVEX ( http://www.mathworks.co.uk/help/matlab/ref/actxserver.html)

Вам нужно первый объявить распознавани речи двигатель

RC = actxserver('SAPI.SpSharedRecoContext'); %connect to speech engine 

А затем настроить различные функции обратного вызова для каждого состояния распознавани:

RC.registerevent({'Recognition' @CallbackFunction; 'Hypothesis' @CallbackFunction; 'FalseRecognition' @CallbackFunction}) 

Содержание функции обратного вызова должна быть вдоль этих линий:

function word = CallbackFunction(varargin) 
    global word 
    result = varargin{length(varargin)-2}; 
    word = result.Phraseinfo.GetText; 
end 

Затем, наконец, переключить распознавани на:

RC.Recognizer.State = 'SRSActive'; 

Вы должны ссылаться на документацию, для которых называются функции обратного вызова и когда.

Вам понадобится также установить словарь грамматики для получения значимых результатов. Поскольку двигатель будет пытаться распознать любое слово иначе.

Смежные вопросы