2013-11-10 4 views
0

Я создаю приложение, которое будет предварительно записывать голос пользователя для каждой буквы на клавиатуре, и когда приложение будет запущено, если пользователь называет «5», то системные типы 5, к которым когда-либо было применено приложение способен принимать входные данные в это время. Я являюсь человеком .NET и занимаюсь XCode.Mac OSX Audio keyboard

Я провел некоторое исследование, и я уверен, что использую AV Foundation для записи звука. Вопрос заключается в том, как использовать распознавание речи в OSX и использовать его для идентификации определенного ключа на клавиатуре ... По достоинству оцените любую обратную связь, даже если это может быть общий совет для подхода, который я должен предпринять для решения этого проекта!

ThankS IN ADVANCE :)!

+0

Посмотрите в моем отредактированном ответе. В OSX есть встроенный речевой распознаватель. Если вы хотите сделать свой собственный, вы можете использовать мой путь с сервером и т. Д. –

+0

Спасибо за вашу помощь. Ценить это! – LearningWizard

ответ

-2

Mac OS X уже имеет библиотеки распознавания речи и синтеза, встроенные! Используйте их.

Speech Programming Topics: Recognizing Speech

+0

Я также сказал ему то же самое в своем ответе, но я думаю, что он хочет сделать свое, поэтому я объяснил, как он мог это сделать без встроенной функции. –

+0

Распознавание речи значительно сложнее, чем «сравнение аудиофайлов» - шаблоны сходства, которые вы должны были бы распознавать для распознавания речи, совершенно не выглядят в сжатом аудио. Подход, который вы описали в своем ответе, просто не полезен. – duskwuff

+0

Я согласен, я никогда не делал этого раньше. Кроме того, сравнение звука очень сложно, поэтому никто не имеет кода. Он должен сделать это самостоятельно. –

0

Позвольте мне сначала пояснить. Я никогда не делал этого раньше, но у меня есть общее представление о том, как это делается. Вам необходимо привязать аудиофайл к определенному числу/ключу. Всякий раз, когда пользователь говорит в микрофон, вы записываете свой голос и загружаете его на сервер, который сравнивает аудиофайл с пользователем с предварительно записанным аудиофайлом, сделанным пользователем.

Вот такой вопрос, который говорит об аудиопечати.

How can I Compare 2 Audio Files Programmatically?

Вы можете сравнить аудио файлы в PHP/Python, и он возвращает значение. Например. Если звуковой файл a.mp3 (на сервере) соответствует новомуRecorded.mp3, только что записанный пользователь, верните a.mp3, а затем просто разделите .mp3 и сохраните ключ.

Что касается записи предложений и команд, возможно, вы сможете сделать то же самое. Я буду продолжать делать больше исследований по этому вопросу и помогать вам как можно больше.

Надеюсь, это даст вам лучшую идею и более простой способ делать вещи.

Также этот https://developer.apple.com/library/mac/documentation/cocoa/reference/ApplicationKit/Classes/NSSpeechRecognizer_Class/Reference/Reference.html

и

https://developer.apple.com/library/mac/documentation/cocoa/conceptual/speech/Articles/RecognizeSpeech.html#//apple_ref/doc/uid/20002081-BCIHEBFH

Это может быть очень полезным и будет использовать встроенное распознавание речи.