2015-11-16 4 views
-1

Я хочу реализовать следующую идею. Мне нужен мой пользователь, чтобы открыть веб-страницу или мобильное приложение и сказать что-то. Речь пользователя будет записана в конец, отправленная на локальный сервер, и я хочу, чтобы сервер обрабатывал его и генерировал некоторый речевой вывод.Какую систему распознавания речи использовать?

Мои вопросы в следующем:

  1. Какие распознавания речи API использовать? В моем случае аудиофайл будет отправлен на сервер, после чего он будет обработан.

  2. Мне нужно узнать имена и фамилии. Это потенциальная проблема, потому что я не живу в англоязычной стране, и имена и фамилии могут быть довольно странными для англоязычных. Я хочу реализовать это, добавив требуемые имена и фамилии в «словарь» системы распознавания речи, поэтому мне нужен тот, который может расширять словарь.

  3. Мне нужно бесплатное решение.

Итак, какой интерфейс распознавания речи следует использовать при реализации моей идеи?

ответ

1

У меня был успех в прошлом, используя CMU Sphinx toolkit для распознавания речи. Я использовал вариацию в приложении Android. Если я правильно помню, это позволило создать словарь конкретных слов, чтобы он выглядел так, чтобы он соответствовал вашим потребностям.

1

Я рекомендую вам взглянуть на Speech API от Nuance. Они имеют лучшее на рынке и доступны на любой платформе. Мы используем их для нашего продукта LinguSocial, который предлагает перевод в реальном времени голосового вызова на мобильные телефоны & стационарные, а также машинные переводы видеочатов.

Смежные вопросы