Не так точно, как вы его определили, если оно смешано с другими звуками, и вот причина; рассмотрим влияние волны, смешанной точно с ее обратным; результат - плоский ответ. Смешение волн может иметь монотонную функцию, то есть эффективно маскировать одну волну с другой так, чтобы первая была недостижима.
Это, скорее всего, способ характеризации «сигнатуры» волны, так что она может присутствовать в результирующем составном волновом файле, но эта подпись будет зависеть от длины волнового файла и от в какой-то степени ожидается, что какие-либо комбинации комбинаций будут выполнены.
Ваш вопрос, вероятно, имеет какое-то отношение к определению того, существуют ли образцы одной работы внутри другой, составной, рабочей. В общем, да, БПФ полезны для определения «подписи» для данной волны и возможности извлечь эту «подпись» из другой волны; они хороши для некоторых вещей (например, сдвиг по частоте, он просто отображается как смещение на БПФ), но не так хорош для других вещей (переменная частотная модуляция, для одной, высокая (или неравномерная) сжатие полосы оригинала сигнал). Другими словами: БПФ - это хороший способ обнаружить «наивное» использование образцов, но определенный ресамплер может изменить исходный образец, чтобы затруднить его обнаружение с помощью БПФ, если он знает, что это используемая техника обнаружения.
(после получения двух ответов): Что делать, если у меня есть библиотека всех известных звуков, которые могут быть в большей WAV и хотите найти вхождения каждого из них в пределах этой WAV? Другими словами, я знаю * каждый * возможный звук, который можно смешать с большим wav, и хотите найти их вхождения? – 2009-05-15 19:45:21
@ ZomCoder: приложения WAV-to-MIDI ужасны, потому что это безумно сложная проблемная область, а не потому, что программисты, работающие над ней, не являются хорошими программистами. Даже если бы вы были лучшим программистом в мире (и я не говорю, что это не так), вам понадобится много времени и много усилий, чтобы добиться результатов лучше, чем того, что там есть. – MusiGenesis
Если у вас есть библиотека всех возможных звуков, и они не сдвинуты с высоты тона, я думаю, что кросс-корреляция будет работать лучше всего. – endolith