2013-03-15 4 views
3

Я пытаюсь создать базовый детектив Emotion из речи с использованием MFCC, их дельт и дельта-дельт. В ряде работ говорится о получении хорошей точности, обучая GMM по этим функциям.Библиотека для обучения GMM из MFCC

Я не могу найти готовый пакет, чтобы сделать то же самое. Я играл с scilearn в Python, Voicebox и аналогичных инструментариях в Matlab и Rmixmod, stochmod, mclust, mixtools и некоторых других пакетах в R. Что было бы лучшей библиотекой для расчета GMM из подготовленных данных?

+0

Что вы подразумеваете под? вы уже указали некоторые пакеты для создания Gaussian Mixture Modeling в R, и есть другие здесь http://cran.r-project.org/web/views/Cluster.html (и, пожалуйста, в следующий раз, когда вы хотите использовать сокращенные аббревиатуры, определите их первый !!) – dickoa

ответ

2

Проблемная проблема - это данные обучения, в которых содержится информация об эмоциях, встроенная в набор функций. Те же функции, которые инкапсулируют эмоции, должны использоваться в тестовом сигнале. Тестирование с помощью GMM будет только хорошим, как ваша универсальная базовая модель. По моему опыту, как правило, с GMM вы можете отделить только мужчин и несколько уникальных колонок. Простое подавление MFCC в GMM было бы недостаточным, поскольку GMM не хранит информацию, изменяющую время. Так как эмоциональная речь будет содержать изменяющиеся во времени параметры, такие как шаг и изменения в периодах тона в дополнение к частотным изменениям параметров MFCC. Я не говорю, что это невозможно с нынешним состоянием технологии, но сложно в хорошем смысле.

Смежные вопросы