2014-02-03 1 views
0

Я занимаюсь распознаванием речи с использованием базы данных TIDigits, которая содержит цифры от нуля до девяти из разных колонок (много файлов).Как я могу работать с различными файлами речевых файлов в Matlab

Мне нужно извлечь 39 функций MFCC из каждого кадра и объединить их в одну матрицу (Характеристики матрицы) для классификации. Я сделал кадрирование и окно для каждого файла, и это привело к неравному количеству кадров для каждого файла.

Проблема, с которой я столкнулась, заключалась в разном количестве кадров из-за различной длины речевых файлов.

Как я могу справиться с этой проблемой без использования формул статистики?

ответ

0

Недавно я столкнулся с этой проблемой при работе с аудио. То, что я сделал, это в основном обрезка длинных функций MFCC, чтобы они соответствовали более коротким. Это хорошо работает для меня.

+0

Спасибо за ваш ответ , Но, обрезав длинные функции MFCC, повлияли ли они на точность классификатора? или вы не пробовали? – Sayf

+0

@Sayf Он обязательно повлияет на точность классификатора, так как он потеряет некоторые функции. Однако разница должна быть относительно небольшой, хотя я не очень подробно их разбирал. – herohuyongtao

+0

Когда вы сказали, что вы урезали длинный MFCC, это означает, что вы отбрасываете функции некоторых фреймов. Мой самый короткий файл содержит 17 кадров (25 мс), а самый длинный - 87 кадров ... Поэтому бессмысленно, если я удалю 60 кадров из самый длинный, большая часть сигнала будет проигнорирована. – Sayf

0

Предполагая, что проблема в том, что вы хотите хранить векторы разной длины вместе, у вас есть несколько логических опций:

  1. Обрезать векторы, ваш результат будет 39 матрицей smallestVectorLength
  2. Padd векторы, ваш результат будет 39 матрицей largestVectorLength
  3. Используйте массив ячеек, результат будет 39-векторов с их соответствующей длиной
+0

Спасибо за ваш ответ, 1-й вариант потеряет некоторую информацию, 2-й вариант. Я пытаюсь установить ноль, но когда я прочитал о классификаторе нейронной сети и как он имеет дело с нулевым значением в векторе, я исключил второй вариант. 3rd one Это работа, если я просто хочу сохранить вектор. У меня есть еще один этап для классификации, и поэтому я думаю, что мне нужна равная матричная векторная матрица MFCC. – Sayf

Смежные вопросы