Я уже использовал HTK (скрытый набор инструментов модели Markov) для распознавания конкретных команд , используемых для управления моим Android-приложением, но в этом случае мне нужно передать некоторые голосовые данные на сервер, и это может потребовать больше времени ,Android-распознавание голоса
Чтобы предотвратить эту задержку, я думаю об использовании pocketsphinx для распознавания голосовых данных локально с помощью приложения Android, так что мне не нужно передавать этот звук на сервер.
Если это хорошая идея, легко ли узнать pocketsphinx с нуля? Кроме того, каковы преимущества и недостатки обоих методов (на основе сервера и локального распознавания голоса), а какой лучше?
Можете ли вы сделать вопрос более ясным и форматировать немного для удобства чтения? – fredrik
Теперь он должен выглядеть лучше. –