Я записал свой голос в Matlab. Теперь я хочу преобразовать этот звук в строки i-e; Письменные предложения в Матлабе. Есть ли способ конвертировать аудио в текст.tlab Преобразование аудио
ответ
Я уверен, что у MATLAB нет встроенной функции «речь-текст».
Быстрый поиск в Google показал хотя бы один проект, интегрирующий речь в текст в MATLAB.
http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html
Некоторые другие программы, которые могут переводить записанные речи в тексте от Microsoft SAPI (встроенный в Windows Vista и Windows 7, и доступен для загрузки для Windows XP), и CMU's Sphinx проект. Nuance Dragon Naturally Speaking - вариант, но он сравнительно дорогой. Для меня не очевидно, как это можно было бы интегрировать в MATLAB.
Вы можете достичь небольшого предела пробега, используя встроенный интерфейс Windows Speech API. Это зависит от вашей системы и т.д. операционной, и вы должны следовать тем же принципам из документации API: http://msdn.microsoft.com/en-us/library/ms723627(v=vs.85).aspx
Использование сервера MATLAB в ACTIVEX ( http://www.mathworks.co.uk/help/matlab/ref/actxserver.html)
Вам нужно первый объявить распознавани речи двигатель
RC = actxserver('SAPI.SpSharedRecoContext'); %connect to speech engine
А затем настроить различные функции обратного вызова для каждого состояния распознавани:
RC.registerevent({'Recognition' @CallbackFunction; 'Hypothesis' @CallbackFunction; 'FalseRecognition' @CallbackFunction})
Содержание функции обратного вызова должна быть вдоль этих линий:
function word = CallbackFunction(varargin)
global word
result = varargin{length(varargin)-2};
word = result.Phraseinfo.GetText;
end
Затем, наконец, переключить распознавани на:
RC.Recognizer.State = 'SRSActive';
Вы должны ссылаться на документацию, для которых называются функции обратного вызова и когда.
Вам понадобится также установить словарь грамматики для получения значимых результатов. Поскольку двигатель будет пытаться распознать любое слово иначе.
- 1. Выделения в новых TLAB и распределениях вне TLAB
- 2. Преобразование аудио-стерео в аудио-байт
- 3. Преобразование аудио файлов CAF
- 4. Преобразование аудио в текст
- 5. Является ли ThreadLocal выделенным в TLAB?
- 6. PHP Преобразование изображения + аудио = видео
- 7. Преобразование аудио и видео в NSData
- 8. Советы - Как начать преобразование видео/аудио
- 9. Преобразование необработанных байтов в аудио в Matlab
- 10. Преобразование видеофайла с SD-карты в аудио
- 11. аудио в 8-битное преобразование образца текста
- 12. Преобразование аудио-только flv в aac: ffmpeg
- 13. Преобразование аудио и видео в формат mp4
- 14. Преобразование аудио в код и наоборот
- 15. Преобразование аудио в FLAC с использованием libsox
- 16. Преобразование аудиофайла wav в формат аудио DSS
- 17. Преобразование файлов Midi в аудио с NAudio
- 18. Очередь аудио Преобразование частоты дискретизации iOS
- 19. Будет ли GC, если TLAB (потоковый локальный буфер распределения) заполнен?
- 20. Распознавание аудио
- 21. Потоковое аудио в браузере
- 22. Декодирование аудио/аудио воспроизведения (AS3)
- 23. Ищем примерное преобразование аудио кода с iPhone caf => m4a
- 24. Преобразование аудио ввода в текст с помощью SAPI
- 25. Преобразование аудио в необработанные данные PCM типа [Double]
- 26. Преобразование файла WAV в байтовый массив замедляет аудио
- 27. Java - преобразование байтового массива аудио в целочисленный массив
- 28. Преобразование любого аудио в формат mp3 с использованием python
- 29. Преобразование базы 64 в аудио Mp3-формат на PHP
- 30. Преобразование аудио с использованием ffmpeg on exec() php function
Это ОЧЕНЬ жесткая проблема - даже самые современные алгоритмы не могут этого сделать. Это не место. –