У меня есть два закодированных файла G729, я взял их версию pcm. Я хочу измерить сходство между этими двумя файлами. эти файлы являются двоичными файлами, поэтому, как можно измерить сходство между двоичными файлами, я написал код на C, который берет шаблоны из первого и ищет похожие во втором, но я хочу иметь меру подобия ... Я много искал в литературе, я нашел jaccard и других, но все еще не могу отбросить, кто из них имеет право на мое дело. Заранее благодарим за помощь.Измерение сходства между двумя двоичными файлами?
ответ
Поскольку вы упоминаете, что файлы являются аудиофайлами, было бы лучше определить меру подобия, основанную на характеристиках звука, а не просто выполнять двоичное сравнение. Быстрый поиск привел к исследовательскому проекту под названием MusicMiner, который может потребоваться для изучения дальнейших идей.
Прежде всего, спасибо за ваше обращение ... Я пытаюсь сделать creptanalysis на уровне открытого текста ... я имею в виду на двоичном уровне..и хочу сравнить выход кодера ... спасибо – Dobs
Я была такая же потребность, и я пришел к решению, что в моем случае работа, но я не могу гарантировать работу она универсальна:
я взял библиотеку, который создает файлы различий. С учетом fileA и fileB в этой библиотеке создается третий файл fileDiff, в котором рассказывается, как передать файл fileA в файл B, какие байты копировать и что добавить. (Для получения дополнительной информации о формате: http://www.w3.org/TR/NOTE-gdiff-19970901.html)
- я работал в Java, поэтому я использовал javaxdelta: http://javaxdelta.sourceforge.net/
- Здесь вы можете реализовать интерфейс, который называется DiffWriter: http://javaxdelta.sourceforge.net/javadoc/com/nothome/delta/DiffWriter.html
- В конце концов вы знаете сколько байт скопировано и сколько добавлено, чтобы перейти от fileA к файлуB
с функцией Я получаю процент. Я знаю, что это не 100% реальный, например, если у есть файлB, равный половине файлаA, то подобие функции составляет 100%.
Это реализация DiffWriter:
public class Distance implements DiffWriter {
private long newData = 0;
private long copiedData = 0;
@Override
public void flush() throws IOException {}
@Override
public void close() throws IOException {}
@Override
public void addData(byte arg0) throws IOException {
newData++;
}
@Override
public void addCopy(long arg0, int arg1) throws IOException {
copiedData += arg1;
}
public double getSimilarity() {
double a = (double) newData;
double c = (double) copiedData;
return ((c/(c + a)) * 100.0);
}
}
Вот как я это называю:
import com.nothome.delta.Delta;
File f1 = new File(...);
File f2 = new File(...);
Distance dw = new Distance();
try {
new Delta().compute(f1, f2, dw);
dw.getSimilarity();
} catch (Exception e) {
e.printStackTrace();
}
- 1. Измерение сходства между двумя векторами
- 2. Измерение семантического сходства между двумя фразами
- 3. Android: измерение сходства между двумя страницами активности
- 4. разница находкой и сходства между двумя текстовыми файлами, используя AWK
- 5. Расстояние между двумя двоичными строками
- 6. Корреляция между двумя двоичными изображениями
- 7. HOG особенность измерение сходства?
- 8. Поиск сходства между двумя документами
- 9. Мера сходства между двумя изображениями
- 10. Процент сходства между двумя colulmns
- 11. Мера сходства между двумя списками
- 12. Измерение расстояния между двумя относительными частотными векторами
- 13. Измерение двух разных (векторных) сигналов сходства
- 14. Интерполяция между двумя файлами
- 15. Diff между двумя файлами
- 16. Пересечение между двумя файлами
- 17. Измерение времени между двумя точками
- 18. Расстояние вращения между двумя двоичными деревьями
- 19. Число разрядов, общее между двумя двоичными числами
- 20. Есть ли разница между исполняемыми двоичными файлами между дистрибутивами?
- 21. Использование сходства косинуса с двоичными данными - Mahout
- 22. Excel: подсчет сходства между двумя списками
- 23. count сходства между двумя массивами с javascript
- 24. Оценка сходства между двумя неспаренными наборами данных
- 25. Поиск сходства между двумя профилями пользователя
- 26. Вычисление сходства между двумя строчными чертежами
- 27. Подсчет сходства между двумя кадрами данных pandas
- 28. Методы количественного определения сходства между двумя цветами?
- 29. Загрузка проблемы с двоичными файлами
- 30. Функция с двоичными файлами svm
http://en.wikipedia.org/wiki/Acoustic_fingerprint –
Как именно вы хотите количественно «аналогично»? Вы хотите абсолютную разницу для каждого образца? Значение R^2 для регрессии наименьших квадратов? Какие два файла? – JoshD
Я хочу найти соотношение, которое определяет, насколько эти два файла похожи друг на друга ... два файла - это выход из кодека G729 ... мы можем принимать кадры из 20 байтов из каждого файла и измерять сходство между этими двумя струны и взять среднее в конце ... достаточно? – Dobs