Какую систему распознавания речи использовать?

-1

Я хочу реализовать следующую идею. Мне нужен мой пользователь, чтобы открыть веб-страницу или мобильное приложение и сказать что-то. Речь пользователя будет записана в конец, отправленная на локальный сервер, и я хочу, чтобы сервер обрабатывал его и генерировал некоторый речевой вывод.Какую систему распознавания речи использовать?

Мои вопросы в следующем:

Какие распознавания речи API использовать? В моем случае аудиофайл будет отправлен на сервер, после чего он будет обработан.
Мне нужно узнать имена и фамилии. Это потенциальная проблема, потому что я не живу в англоязычной стране, и имена и фамилии могут быть довольно странными для англоязычных. Я хочу реализовать это, добавив требуемые имена и фамилии в «словарь» системы распознавания речи, поэтому мне нужен тот, который может расширять словарь.
Мне нужно бесплатное решение.

Итак, какой интерфейс распознавания речи следует использовать при реализации моей идеи?

источник

2015-11-16 starwars25

У меня был успех в прошлом, используя CMU Sphinx toolkit для распознавания речи. Я использовал вариацию в приложении Android. Если я правильно помню, это позволило создать словарь конкретных слов, чтобы он выглядел так, чтобы он соответствовал вашим потребностям.

источник

2015-11-16 18:58:34 mattherman

Я рекомендую вам взглянуть на Speech API от Nuance. Они имеют лучшее на рынке и доступны на любой платформе. Мы используем их для нашего продукта LinguSocial, который предлагает перевод в реальном времени голосового вызова на мобильные телефоны & стационарные, а также машинные переводы видеочатов.

источник

2015-11-19 11:14:33 marcelgoya

Какую систему распознавания речи использовать?

ответ

Смежные вопросы