Я создал два алгоритма кластеризации: k-средство и divisive, возможно, позже я также добавлю агломерат. Мне нужно проанализировать, насколько хороши они данные с высоким размером, и для этого мне нужно рассчитать среднее/суммарное расстояние до центра кластеров. В случае k-средств это легко, у меня есть центроид, но как найти центр в алгоритме divisive/aglomerative? Пока я здесь: Я в настоящее время внедряю дистанцию Euclede, Manhattans и Pearsons, есть ли еще дистанционные меры, которые я мог бы использовать? Спасибо заранее!Анализ кластеров - поиск центра кластера
ответ
Целью моей работы является анализ этих кластеров, когда им приходится создавать кластеры из данных с большой размерностью. Трудно их оценить, и очень маловероятно, что результат будет полностью справедливым, поэтому я собираюсь использовать среднее, накопленное расстояние между записями в одном кластере и минимальное расстояние между двумя записями из разных кластеров. О том, как найти центр кластера в иерархических алгоритмах кластеризации - та же самая формула, используемая в k-значении, используемая для пересчета центроида после каждой итерации.
Вы можете получить эту книгу:
- Энциклопедии расстояний, Мишель Дез, Елена Дез, 590 страниц.
, который охватывает многие функции альтернативного расстояния, которые вы могли бы использовать.
Возможно несколько сто различных расстояния ...
Однако, вы также должны смотреть в ваш метод оценки - если она медианы на основе, она будет быть смещена в стороне к-средств. Таким образом, сравнение, вероятно, несправедливо.
Кроме того, если вы используете искусственные данные, убедитесь, что вы не несправедливо относитесь к одному методу над другим, потому что этот метод коррелирует с тем, как вы генерируете свои данные (например, если вы создаете кластеры Гаусса, он предпочитает такие методы, как k-mean).
- 1. Поиск центра кластера
- 2. анализ кластера? ярлык кластера
- 3. автомасштабирование кластера кластеров
- 4. Анализ кластера реализации R
- 5. Анализ кластеров, 2-мерные данные?
- 6. Запуск кластера кластеров AppFabric автоматически
- 7. Пример кластера кластеров карт Google
- 8. «Анализ кластеров» с MySQL
- 9. Анализ кластеров K-медоидов
- 10. Анализ кластеров с помощью ромашки
- 11. Поиск разброса каждого кластера из Kmeans
- 12. Устойчивый поиск кластеров в облаке
- 13. Сравнительный анализ Redis-кластера
- 14. Поиск гауссовых вероятностей из предопределенных кластеров
- 15. Центр кластеров в quickminer
- 16. Удаление приложения из кластера кластеров службы
- 17. переборе OpenLayers 3 кластеров в источнике кластера
- 18. один кластер кластера услуг или несколько кластеров?
- 19. Анализ кластеров в R: определение оптимального количества кластеров
- 20. NetworkX - Поиск естественных кластеров точек на графике
- 21. Анализ кластера ProClus в R
- 22. Анализ однородности кластера и использование оператора производительности диапазона кластеров в RapidMiner
- 23. SAS - расстояние наблюдения до центра кластера
- 24. Анализ кластеров в Google Container Engine
- 25. Анализ кластеров в R с отсутствующими данными
- 26. Поиск центра просмотра
- 27. Поиск центра дерева
- 28. Поиск центра тяжести многоугольника?
- 29. Поиск центра приложения - VB.net
- 30. Поиск того, какой ряд присвоен кластеру - скопление кластеров Matlab