2014-06-09 3 views
-1

Я ищу библиотеку с открытым исходным кодом для обнаружения разговорной речи, используемой в аудиофайле, например, в wav-файле.Идентификация аудиоязыка

Я попробовал CMU sphinx, но не смог понять, как его использовать для определения языка? Кто-то может помочь?

ответ

1

Вы можете попробовать CMU sphinx во всех режимах декодирования телефона. Модели поездов для языков, которые вы хотите идентифицировать. Выберите язык, который лучше всего подходит для оценки.

2

Если вы хотите изучить другой инструментарий, вы должны рассмотреть Kaldi [1]. Это инструментарий для распознавания речи с открытым исходным кодом с системой распознавания громкоговорителей (которая использует аналогичные модели как систему идентификации языков) в туловище и экспериментальный язык. Идентификационная установка в песочнице language_id. После проверки репозитория вы можете переключиться на изолированную среду LID с помощью svn switch ^/sandbox/language_id. Примеры LID приведены в egs/lre07.

Какой бы инструмент вы ни использовали, я рекомендую систему на основе i-Vector вместо фонотектической системы. Система на основе i-Vector будет легче настраиваться, так как она не требует расшифровки транскриптов и значительно быстрее, поскольку она позволяет избежать декодирования.

Смежные вопросы