Я пытаюсь создать приложение, которое решает проблему диарилизации динамиков с помощью API-интерфейсов распознавания когнитивных динамиков Microsoft.Распознавание динамиков в реальном времени с помощью Microsoft Cognitive
Глядя на sample project и читая APIs documentation, я понял, что должно быть сделано признание отправки wav-файла в службу, что противоречит моей цели сделать это в режиме реального времени.
Проведено ли какое-то исследование по этому вопросу? Можно ли использовать эти API, или я должен искать другую дорогу?