Я пытаюсь создать приложение с использованием IBM Watson Services, которое принимает SPEECH в качестве входных данных, которые затем преобразуются в TEXT с помощью IBM Watson Speech to Text API, а затем этот текст отправляется в IBM Watson Conversation API и дает результат в TEXT. Теперь последний TEXT, полученный из API беседы, далее отправляется в TEXT TO SPEECH API и возвращает SPEECH, который является желаемым результатом. Короче говоря, вход должен быть РЕЧИМ, а выход должен также быть SPEECH.Есть ли какой-либо IBM Watson Speech to Speech API?
Весь этот процесс завершен в 5-6 шагах плюс его также откладывание при получении вывода.
Есть ли способ в IBM Watson сделать эти шаги короче.
Для большей ясности, смотрите изображение здесь
https://developer.ibm.com/answers/questions/334561/is-there-any-ibm-watson-speech-to-speech-api.html
Ответ «нет». –
Привет ... Спасибо за ответ. Значит, я должен сделать это за 5-6 шагов? –
@ R.Sehdev Полностью оффтопный вопрос, но выполняет ли речь о сервисе Speech To Text от watson (интегрированный с пользовательской моделью) на самом деле понимает азиатский акцент на субконтиненте? Когда я пробовал с пользовательской моделью, он просто не понимал более 90% речи –