2016-02-19 2 views
4

я могу использовать ан-нас вещи, которые приходят с Sphinx4, без проблем:Используйте немецкий словарь и язык модель с Sphinx4

cfg.setAcousticModelPath("resource:/edu/cmu/sphinx/models/en-us/en-us") 
cfg.setDictionaryPath("resource:/edu/cmu/sphinx/models/en-us/cmudict-en-us.dict") 
cfg.setLanguageModelPath("resource:/edu/cmu/sphinx/models/en-us/en-us.lm.bin") 

я могу использовать это, чтобы записать в записи Английский звуковой файл.

Теперь я хочу использовать это с Немецкий записей. На веб-сайте я нахожу ссылку на Acoustic and Language Models. В нем есть архив «Немецкий Voxforge». Это я нашел соответствующие файлы для акустической модели . Насколько мне известно, он не содержит словарь или языковую модель.

Как получить словарь и языковая модель Путь для немецкого языка в Sphinx4?

ответ

3

Вы сами создаете их. Вы можете создать языковую модель из субтитров или дампов википедии. Документация: here.

Последние немецкие модели на самом деле не на странице CMUSphinx, они находятся на github/gooofy. В этом проекте gooofy вы можете найти документацию по словарю, модели и связанные с ними материалы.

+0

Извините. Прояснить. Из загрузок с gooofy я должен использовать 'voxforge.dic' (26K слов, а en-us имеет 134K) и' voxforge.lm.DMP', правильно? –

+0

Да, они работают. Окончание файла должно быть изменено на нижний регистр '.dmp', потому что Sphinx4 распознает только расшифровки нижнего регистра. –

Смежные вопросы