Я новичок в области «распознавания голоса» в Android.android: распознавание речи Какие доступные технологии
У меня есть требование в моем приложении иметь «распознавание речи». Так что я делаю домашнее задание. Я нашел, что 1. У Android SDK есть поддержка для этого, и он использовал «распознавание голоса Google» Итак, из того, что я понимаю, погода мы вызываем распознавателя по своему усмотрению или используем класс SpeechRecogniser, фактическое признание выполняется на Google Cloud Server. Я пробовал пример приложений, используя оба метода, и скорость совпадения в обоих случаях очень низкая. \ (Прежде всего, это мое нахождение? Я не получил правильное совпадение для большинства слов/предложений, которые я пробовал).
Будет ли разница в результатах этих двух методов, т.е. запуск намеренно/или с использованием класса SpeechRecogniser)
ли все приложения в зависимости от этого Google технологии, где голос отправить в звуковые байты и распознается на сервере облачных вычислений. Я видел, что Shazam использует другую технологию, но у них есть своя база данных. Существуют ли какие-либо другие используемые технологии
Я видел много «сири для андроида». Любые заметки о том, как эти приложения действительно работают?
Большое спасибо за ваше время и помощь.
благодарит за ответы. Что касается пункта 2, у shazam есть база данных для всех песен, которые она поддерживает, со всеми возможными «отпечатками пальцев» для каждой песни. Его звуки действительно огромны. и в отношении пункта 3, что мое чтение говорит, что основная технология Siri - это AI.Только если ИИ эффективно используется, можно получить распознаватель голоса – png
Коррекция: вам не нужен ИИ для распознавания голоса. Вам нужен ИИ, чтобы попытаться реализовать приложение, в котором есть беседа с пользователем. – gregm