Я занимался домашней работой по обработке аудиосигнала. Я прочитал статью и смущен насчет формулы: . Эта формула используется для обработки аудиосигнала с частотой 44100 Гц, 16 бит, одноканального. Аудио было предварительно обработано и разрезано на 1024 кадра ширины. F(w)
является FFT коэффициенты каждого кадра и w with - above
равна половине частоты кадров, 22050.
Обработка аудиосигнала с использованием Python
Я искал много, самое важное Analyze audio using Fast Fourier Transform. Но я все еще не могу понять это ясно. У меня есть коэффициенты FFT, с scipy и numpy, размером 1024 ширины. Тогда как мне выполнить формулу? Соответствует ли это суммам от 0 до 512 значений массива?
Надеюсь, что кто-нибудь может мне помочь. Заранее спасибо.
Что вы уже пробовали? Обычно мы ожидаем увидеть исходный код вашей попытки. – marko
и F (w) * действительно * эффективность FFT каждого кадра? Похож на меня. Возможно, было бы полезно увидеть уравнение для него. – marko
Я много искал в Google и stackoverflow. Я дал то, что, по моему мнению, самый полезный ресурс для меня. Я прочитал аудиосигнал, предварительно обработал его и нарезал его в рамки. Я сделал FFT на кадрах. Кажется, что у меня есть коэффициенты FFT. Но я не знаю, как использовать коэффициенты FFT для выполнения формулы. Я также надеюсь, что «F (w)» - это уравнение. Если это так, мне не нужно сюда приезжать. Все прочитанные мной статьи просто говорят мне, что «F (w)» - это коэффициенты FFT для каждого кадра. @Marko – zhangyangyu