2010-08-26 3 views
7

Есть ли программа, которая распознает битрейт MP3? Я не говорю об эффективном битрейте, в котором был закодирован файл, но о реальном битрейте, который может быть рассчитан только с помощью анализа частотного спектра.Определение битрейта MP3 через анализ частотного спектра

Например, если у меня есть MP3, закодированный в 128 Кбит/с, размер которого составляет 1 МБ, а затем я перекодирую этот MP3 до 320 кбит/с, размер которого составляет 3 МБ, у меня будет такая же идентичная звуковая дорожка, но с разными размерами ,

Если у меня есть MP3 320 kbps и я перекодирую его на 128 кбит/с, я потеряю некоторое качество и, следовательно, некоторый размер файла.

Но все же у меня нет возможности проверить, что 320 кбит/с является «реальным» битрейтом моего MP3.

Подробности описаны в этой статье: http://www.fileden.com/files/2009/2/14/55/My%20Documents/MP3%20Bit%20Rate%20Quality%20Detection%20through%20Frequency.pdf

+0

Вы теряете качество так или иначе, mp3 с потерями каждый раз, когда он закодирован ... – MarcusJ

ответ

0

Единственное, что вы можете легко определить из анализа частотного спектра является то, что частота дискретизации входного файла mp3.

Например, если ваш mp3 выбран на 44100, у вас не будет звука выше 22050 Гц, и это будет хорошо видно на графике спектра.

Поскольку вы проникающих в трансцендентальной области здесь, попробуйте следующее:

  • закодировать mp3 в 128kbps
  • перекодировать сказать 320kbps
  • попробовать RAR-Инг или 7Z-Инг получившийся файл и исходный файл , Соблюдайте коэффициенты сжатия.

Их энтропия, т.е. случайность будет отличаться, и, возможно, это число скажет вам что-то о том, сколько информации «сфабриковано» в расширении битрейта во время перекодирования.

+0

Если процесс перекодирования 100% соответствует стандартам , то никакая информация вообще не должна быть «сфабрикована». Одна вещь, которая изменится в версии 320 Кбит/с, хотя и является стереорежимом. Значение по умолчанию для 128 кбит/с - это совместное стерео, тогда как по умолчанию 320 - это «истинное» стерео. Итак, если вы попробуете это, вы, вероятно, должны заставить использовать тот же режим стерео для обоих битрейтов. (Разумеется, частота дискретизации тоже должна быть одинаковой, но это должно быть само собой разумеющимся.) Также версия 320 кбит/с должна быть закодирована без фильтра отсечки, поскольку она уже применена. –

2

Частота среза и скорость передачи бит независимы. Да, большинство людей используют пресеты, поэтому между ними существует корреляция, но она не детерминирована.

0

Вы можете открыть файл «Adobe Audition» или «Cool Edit» и открыть окно анализа частоты. Если частотные линии до 20 кГц будут больше битрейт mp3, может быть, 320 кбит/с, если частотные линии сокращаются меньше, чем 20 кГц, это не 320 Кбит/с.

12

Во-первых, https://www.google.com/?q=mp3+cutoff+frequency может быть довольно информативным.

Во-вторых, почти все MP3 кодируются с использованием пресетов с довольно стандартными многофазными фильтрами нижних частот. Поскольку на самом деле невозможно добиться сжатия без потерь с помощью MP3, то, что потеряно, на самом деле является высшими гармониками базовых частот (см. FFT, DCT, вейвлет-преобразования и т. Д.); фильтр применяется таким образом, чтобы результаты более позднего анализа Фурье спектра были более согласованы с диапазоном слуха человека (т. е. неустранимые/маскированные частоты исключаются из анализа вообще). На самом деле это невозможно для достижения высокого сжатия без отсечения/искажения более высоких частот, поскольку на самом деле они занимают большую часть пространства в потоке бит.

Конечно, без отсечки ограничение по частотной области было бы менее точным, но было бы еще.Обрезание применяется, помимо прочего, так, что артефакты сжатия генерируются вне диапазона психоакустического слуха.

В качестве отправной точки - выполнить спектральный анализ потока (в реальном времени SA с помощью Winamp clone будет достаточно, если более высокие частоты будут достаточно насыщенными, вы также можете просто сделать спектрограмму, если у вас есть инструменты), и найдите точка отсечки. В приведенном ниже примере отсечка возникает @ 15 кГц, которая сообщает мне, что поток изначально был сжат @ 128 кбит/с; Я даже зашел так далеко, чтобы сказать, что на самом деле можно отличить < = 128 kpbs потоков от уха со многими видами музыки (drum'n'bass и другие жанры электронной музыки с большим количеством максимумов приходят на ум).

MP3 spectrum analysis

Наиболее распространенные обрезаний являются: (обратите внимание, что они являются "жесткий" в ЦБ РФ и "мягкие" в ABR/VBR)

  • 128 кбит: 15-16 кГц (очень слышно на рок/электронная музыка «потеря пространства» эффект)
  • 192 кбит: ~ 19 кГц (еле слышно в большинстве случаев считается прозрачным большинством)
  • 256-320 кбит:> ~ 20кГц (неразборчиво)

Да, я знаю, что некоторые люди могут слышать выше 20 кГц, но маскирующий эффект появляется в музыке и фактическое время срабатывания от динамики средств что в реальной музыке отсечка 20 кГц не имеет отношения к качеству звука.

Источник: собственный Reasearch в качестве инженера аудио плюс http://www.whatinterviewprep.com/prepare-for-the-interview/spectral-analysis/ в качестве дополнительной ссылки

Смежные вопросы