В настоящее время я работаю над инструментом, позволяющим читать все мои уведомления благодаря подключению к различным API.Распознавание речи, nodeJS
Он отлично работает, но теперь я хотел бы поместить некоторые вокальные команды для выполнения некоторых действий.
Как и когда программное обеспечение говорит «Одна почта от Боба», я хотел бы сказать «Прочтите» или «Архивировать».
Мое программное обеспечение работает через сервер узлов, в настоящее время у меня нет реализации браузера, но это может быть план.
Каков наилучший способ в узле JS включить речь в текст?
Я видел много потоков на нем, но в основном это браузер и, если возможно, я хотел бы избежать этого в начале. Является ли это возможным?
Другая проблема заключается в том, что для некоторых программ требуется вход wav-файла. У меня нет файла, я просто хочу, чтобы мое программное обеспечение всегда слушало то, что я говорю, чтобы реагировать, когда я говорю команду.
У вас есть информация о том, как я могу это сделать?
Приветствия
Я видел некоторые реализации, которые подключаются к сервисам google для этого, я предполагаю, что это то, о чем вы говорите. Я сомневаюсь, что на некоторое время у вас будет собственный парсер речи. – Phix