Я хочу реализовать следующую идею. Мне нужен мой пользователь, чтобы открыть веб-страницу или мобильное приложение и сказать что-то. Речь пользователя будет записана в конец, отправленная на локальный сервер, и я хочу, чтобы сервер обрабатывал его и генерировал некоторый речевой вывод.Какую систему распознавания речи использовать?
Мои вопросы в следующем:
Какие распознавания речи API использовать? В моем случае аудиофайл будет отправлен на сервер, после чего он будет обработан.
Мне нужно узнать имена и фамилии. Это потенциальная проблема, потому что я не живу в англоязычной стране, и имена и фамилии могут быть довольно странными для англоязычных. Я хочу реализовать это, добавив требуемые имена и фамилии в «словарь» системы распознавания речи, поэтому мне нужен тот, который может расширять словарь.
Мне нужно бесплатное решение.
Итак, какой интерфейс распознавания речи следует использовать при реализации моей идеи?