Если вы хотите изучить другой инструментарий, вы должны рассмотреть Kaldi [1]. Это инструментарий для распознавания речи с открытым исходным кодом с системой распознавания громкоговорителей (которая использует аналогичные модели как систему идентификации языков) в туловище и экспериментальный язык. Идентификационная установка в песочнице language_id. После проверки репозитория вы можете переключиться на изолированную среду LID с помощью svn switch ^/sandbox/language_id. Примеры LID приведены в egs/lre07.
Какой бы инструмент вы ни использовали, я рекомендую систему на основе i-Vector вместо фонотектической системы. Система на основе i-Vector будет легче настраиваться, так как она не требует расшифровки транскриптов и значительно быстрее, поскольку она позволяет избежать декодирования.