2016-03-09 1 views
-1

У меня есть набор данных (уже масштабируется), состоящий из в общей сложности 8 колонок:координат Участок для кластеризации Visualitzation/Анализ

  • первый столбец, указывающими назначенный кластер принадлежит каждое наблюдение,
  • и 7 зависимых переменных (каждый в другой колонке).

Я хотел бы разработать кластерную визуализацию через координатный график в R, как показано в следующем блоге (http://blog.datascienceheroes.com/short-lesson-on-cluster-analysis/).

Может ли кто-нибудь помочь мне с этим?

ответ

1

Многие варианты. Вы могли бы сделать

library(GGally) 
ggparcoord(aggregate(mtcars, list(as.factor(cutree(hclust(dist(mtcars)), k = 4))), mean), columns=-1, groupColumn=1) 

или

library(parcoords) 
parcoords(
    aggregate(mtcars, list(cutree(hclust(dist(mtcars)), k = 4)), mean), 
    color = list(colorScale = htmlwidgets::JS('d3.scale.category10()'), colorBy = "Group.1") 
) 
parcoords(
    transform(mtcars, cluster = cutree(hclust(dist(mtcars)), k = 4)), 
    color = list(colorScale = htmlwidgets::JS('d3.scale.category10()'), colorBy = "cluster") 
) 
0

У вас есть код для функции вам нужно (plot_clus_coord) here.

Смежные вопросы