Были ли какие-либо подходы к созданию звука с помощью сверточных нейронных сетей?Производить аудио со сверточными нейронными сетями
Существует множество подходов к созданию изображений через конверты. Но я не вижу статей или сообщений о создании звука.
По этой теме на stackoverflow, пост автор говорит:
«Я узнал, что звук может быть представлен в виде спектрограммы.»
Итак, почему это невозможно?
Чтобы сделать это с Convnets, я должен:
а) Использование LSTM с CONV слоями?
B) Какой должен быть выход? С учетом спектрограммы ...