У меня есть ряд точек (длинный, лат)igraph результат обнаружения сообщества имеет слишком много совпадений
1) Найдено расстояние гаверсинуса между всеми точками 2) сохранил это в файл CSV (источник, место назначения, алгоритм веса) 3) Считать файл CSV и генерируется взвешенный граф (где вес является расстоянием между гаверсинуса) 4) Используется igraphs обнаружение сообщества - fastgreedy
Я ожидал кластеры с низким расстоянием быть очень друг друга, я ожидал чего-то похожего на kmeans (без отдельных разделов в пространстве), но в моих результатах не было порядка.
Вопрос: Почему алгоритм обнаружения сообщества не дает мне результатов, подобных кластерам kmeans? Если im использует одни и те же точки/расстояния между точками, то почему существует так много перекрытий между сообществами? Я просто ищу какую-то интуицию относительно того, почему это не работает, как я ожидал.
Благодаря
DBSCAN и OPTICS, вероятно, лучше подходят для этого. Они могут использоваться с расстоянием Хаверсина (например, в ELKI). –