Распознавание голоса в зависимости от речи

Я ищу решения для решения распознавания речи, зависящего от голоса, для встроенного устройства. Я смотрел на карманы, но из-за того, что я до сих пор не знаком с этим, я подумал, что может быть, может быть, кто-то более опытный. Возможно ли использование pocketsphinx для реализации такого распознавания речи. Вместо использования акустической и языковой модели он должен записывать звук, извлекать его функции, а затем сопоставлять его с тем, что говорят. Возможно ли реализовать этот поток с помощью pocketsphinx? Если это не может кто-то указать мне на правильное направление для такого решения? Спасибо.Распознавание голоса в зависимости от речи

источник

2012-12-04 Ray

Возможно ли использование pocketsphinx для реализации такого распознавания речи.

Там нет такой функциональности в pocketsphinx API

Что вы можете сделать, это использовать sphinxbase для первого извлечения коэффициентов MFC см sphinx_fe источник, например.

Затем вы можете применить алгоритм DTW для сравнения записи. Реализация DTW очень просто, это всего лишь 50 строк кода:

http://en.wikipedia.org/wiki/Dynamic_time_warping

Есть несколько библиотек, которые реализуют DTW, а также, вы можете найти ссылки на страницы Википедии.

Было бы здорово увидеть патч pocketsphinx, демонстрирующий реализацию DTW.

источник

2012-12-05 07:51:48

Распознавание голоса в зависимости от речи

ответ

Смежные вопросы