При чтении аудио файл, используя что-то такое, какКаковы данные, возвращаемые при чтении WAV-файла?
rate, wavData = scipy.io.wavfile.read('test.wav')
что именно делает данные внутри wavData
представляют?
При чтении аудио файл, используя что-то такое, какКаковы данные, возвращаемые при чтении WAV-файла?
rate, wavData = scipy.io.wavfile.read('test.wav')
что именно делает данные внутри wavData
представляют?
wavData - это массив чисел, каждый из которых представляет собой один образец аудиосигнала. Образцы представляют собой моментальные снимки амплитуды звука, равномерно распределенные по времени. Таким образом, если ваш курс возвращается как 48000, то первые 48000 элементов wavData будут составлять 1 секунду аудиосигнала. Для получения дополнительной информации читайте о PCM по википедии: https://en.wikipedia.org/wiki/Pulse-code_modulation.
А что, если запись стерео? –
Если запись стерео, 'wavData' имеет форму (n, 2). Два столбца - это левый и правый каналы. –