Я не уверен, где разместить это сообщение. Однако это общий вопрос. Я программирую голосовое программное обеспечение, и у меня возникла мысль.System.Speech and Neural Networks
Если бы я должен был программировать речевую нейронную сеть. Какие варианты лучше всего взять?
Я знаю, что у Ахорда есть компьютерное обучение с помощью Fuzzy Logic. Однако, если бы я хотел начать с нуля.
Я бы использовал обратное распространение и, возможно, рекурсивное обучение. Был бы способ, которым я мог бы извлечь речевые звуковые волновые файлы по умолчанию, которые использует MS Speech, вместо того, чтобы записывать каждое слово на английском языке в звуковую волну.
Раньше у меня была запрограммированная система прямого и обратного распространения нейронных сетей.
Мой вопрос в данный момент, есть способ вытащить звуковые волновые файлы для реализации входов, или мне нужно записать каждое слово в звуковую волну?
Моя долгосрочная цель в течение следующих 3 лет заключается в том, чтобы моя программа отличала структуру предложения, тогда программа могла бы объединять существительные, глаголы, наречия и т. Д. И т. Д.,. Поэтому он может создавать собственные предложения, чтобы задать вопрос пользователю.
Я не хочу использовать открытый источник, за исключением звуковых волн. Я могу справиться с кодированием. Мне просто нужно знать, могу ли я вытащить звуковые волны MS Speech или мне нужно записать их самостоятельно?
Это не имеет значения, если у вас есть все слова, которые вам нужны. Поскольку программа говорит только слова (не распознавая слова), это не имеет значения. Проблема в том, что если у вас есть смесь слов, исходящих из двух мест, было бы бессмысленно иметь какие-то слова с немецким Accent и другими с итальянским Accent. Если программа должна была слушать слова, которые являются другой историей, потому что вам нужно будет распознать много людей, которые потребуют много образцов каждого слова. – jdweng
Программа в конечном итоге будет учиться, когда я говорю с ней. Поэтому система будет слушать слова, когда я говорю. Например, если я скажу «сколько у меня времени?» Система будет принимать каждое слово на основе повторения и размещать их в базе данных.Так наречия наречия и так далее. Вот где звучит wav. – campnerd
Причина, по которой мне было интересно, что MS Wav - это я из Юго-Восточной Америки, у меня очень сильный южный тянут. Поэтому я не хочу, чтобы система распознавала только один акцент. Я хочу, чтобы он был универсальным. На данный момент MS wav - мой единственный вариант. – campnerd