2016-01-24 2 views
1

У меня есть ряд точек (длинный, лат)igraph результат обнаружения сообщества имеет слишком много совпадений

1) Найдено расстояние гаверсинуса между всеми точками 2) сохранил это в файл CSV (источник, место назначения, алгоритм веса) 3) Считать файл CSV и генерируется взвешенный граф (где вес является расстоянием между гаверсинуса) 4) Используется igraphs обнаружение сообщества - fastgreedy

Я ожидал кластеры с низким расстоянием быть очень друг друга, я ожидал чего-то похожего на kmeans (без отдельных разделов в пространстве), но в моих результатах не было порядка.

Вопрос: Почему алгоритм обнаружения сообщества не дает мне результатов, подобных кластерам kmeans? Если im использует одни и те же точки/расстояния между точками, то почему существует так много перекрытий между сообществами? Я просто ищу какую-то интуицию относительно того, почему это не работает, как я ожидал.

Благодаря

+0

DBSCAN и OPTICS, вероятно, лучше подходят для этого. Они могут использоваться с расстоянием Хаверсина (например, в ELKI). –

ответ

0

Ваш подход не работает, потому что обнаружение быстро жадное сообщество ожидает сходства в качестве весов, а не расстояние.

(На самом деле, это, вероятно, только одна из причин. Другой является то, что алгоритмы обнаружения сообщества в igraph были разработаны для разреженных графов. Если вы рассчитали все расстояния между всеми парами точек, ваш график плотно, и эти алгоритмы не подходят).

Смежные вопросы