2016-06-19 3 views
0

Я не уверен, где разместить это сообщение. Однако это общий вопрос. Я программирую голосовое программное обеспечение, и у меня возникла мысль.System.Speech and Neural Networks

Если бы я должен был программировать речевую нейронную сеть. Какие варианты лучше всего взять?

Я знаю, что у Ахорда есть компьютерное обучение с помощью Fuzzy Logic. Однако, если бы я хотел начать с нуля.

Я бы использовал обратное распространение и, возможно, рекурсивное обучение. Был бы способ, которым я мог бы извлечь речевые звуковые волновые файлы по умолчанию, которые использует MS Speech, вместо того, чтобы записывать каждое слово на английском языке в звуковую волну.

Раньше у меня была запрограммированная система прямого и обратного распространения нейронных сетей.

Мой вопрос в данный момент, есть способ вытащить звуковые волновые файлы для реализации входов, или мне нужно записать каждое слово в звуковую волну?

Моя долгосрочная цель в течение следующих 3 лет заключается в том, чтобы моя программа отличала структуру предложения, тогда программа могла бы объединять существительные, глаголы, наречия и т. Д. И т. Д.,. Поэтому он может создавать собственные предложения, чтобы задать вопрос пользователю.

Я не хочу использовать открытый источник, за исключением звуковых волн. Я могу справиться с кодированием. Мне просто нужно знать, могу ли я вытащить звуковые волны MS Speech или мне нужно записать их самостоятельно?

+0

Это не имеет значения, если у вас есть все слова, которые вам нужны. Поскольку программа говорит только слова (не распознавая слова), это не имеет значения. Проблема в том, что если у вас есть смесь слов, исходящих из двух мест, было бы бессмысленно иметь какие-то слова с немецким Accent и другими с итальянским Accent. Если программа должна была слушать слова, которые являются другой историей, потому что вам нужно будет распознать много людей, которые потребуют много образцов каждого слова. – jdweng

+0

Программа в конечном итоге будет учиться, когда я говорю с ней. Поэтому система будет слушать слова, когда я говорю. Например, если я скажу «сколько у меня времени?» Система будет принимать каждое слово на основе повторения и размещать их в базе данных.Так наречия наречия и так далее. Вот где звучит wav. – campnerd

+0

Причина, по которой мне было интересно, что MS Wav - это я из Юго-Восточной Америки, у меня очень сильный южный тянут. Поэтому я не хочу, чтобы система распознавала только один акцент. Я хочу, чтобы он был универсальным. На данный момент MS wav - мой единственный вариант. – campnerd

ответ

0

Обработка естественного языка (NLP) - это текстовый подход к пониманию машины. Есть некоторые очень хорошие документы, которые могут дать вам место, чтобы начать:

https://openreview.net/pdf?id=B1-q5Pqxl

и

https://arxiv.org/pdf/1611.09830v2.pdf

спичечной LSTM Neural Network Architecture, кажется, современное состояние искусства как вы говорите:

Моя долгосрочная цель в ближайшие 3 года - иметь мою программу ish, то программа сможет вместе вместе существительные, глаголы, наречия и т. д. и т. д.,. Таким образом, можно создать собственные предложения, чтобы задать вопрос пользователю.

Некоторые примеры кода был опубликован Wang и Цзян: https://github.com/shuohangwang/SeqMatchSeq

Ваша цель совет, но я считаю, достижима. Уже достигнуты значительные вехи. Удачи!

Смежные вопросы