Производить аудио со сверточными нейронными сетями

Были ли какие-либо подходы к созданию звука с помощью сверточных нейронных сетей?Производить аудио со сверточными нейронными сетями

Существует множество подходов к созданию изображений через конверты. Но я не вижу статей или сообщений о создании звука.

По этой теме на stackoverflow, пост автор говорит:

«Я узнал, что звук может быть представлен в виде спектрограммы.»

Итак, почему это невозможно?

Чтобы сделать это с Convnets, я должен:

а) Использование LSTM с CONV слоями?

B) Какой должен быть выход? С учетом спектрограммы ...

2017-01-23 KenobiShan

Да, конечно, WaveNet от Deepmind производит звук, очень похожий на «человекоподобное» качество. Он также может генерировать музыку.

2017-01-24 10:11:43

ответ