Я действительно запутался, как вычислить точность и вызвать в приложениях кластеризации.Как вычислить точность и отзыв в кластеризации?
У меня есть следующие ситуации:
Даны два множества A и B. При использовании уникального ключа для каждого элемента можно определить, какой из элементов A и B матча. Я хочу сгруппировать эти элементы на основе функций (конечно, не используя уникальный ключ).
Я делаю кластеризацию, но я не уверен, как вычислить точность и вспомнить. Формулы, согласно статье «Расширенные Графики производительности для кластера Retrieval» (http://staff.science.uva.nl/~nicu/publications/CVPR01_nies.pdf) являются:
р = точность = соответствующие извлекаемые элементы/извлекаемые изделия и г = напомним = соответствующие полученные элементы/соответствующие пункты
Я действительно не понимаю, какие элементы попадают под какую категорию.
Что я сделал до сих пор, я проверил внутри кластеров, сколько совпадающих пар у меня (с использованием уникального ключа). Это уже одна из точности или отзыва? И если да, то какой из них и как я могу вычислить другой?
Обновление: Я только что нашел еще один документ с названием «F-Measure для оценки неконтролируемого кластеризации с неопределенным количеством кластеров» на http://mtg.upf.edu/files/publications/unsuperf.pdf.
вы можете проверить этот вопрос тоже? http://stackoverflow.com/questions/32404742/how-to-calculate-clustering-success-pre-assigment-true-classes-are-known – MonsterMMORPG