Я хочу использовать sphinx4 для распознавания голоса общего назначения, например. вы говорите приложение что-то, и оно печатает то, что вы сказали. Однако, когда я просматриваю примеры, все дело в признании очень небольшого количества лексики. Есть ли хороший учебник, чтобы помочь настроить его на распознавание чего-то более сложного, например. диалог между двумя людьми?Как настроить sphinx4 для распознавания общего назначения?
PS: Я считаю, что sphinx4 уже имеет правильные акустические модели и словари, но файл lm
предназначен для определенных приложений, поэтому мне нужен файл lm
, правильно?