2014-10-28 2 views
2

У меня есть много точек данных, которые сгруппированы следующим образом, используя Scipy Иерархическая кластеризация. Скажем, я хочу обрезать дендрограмму на уровне «1500»? Как это сделать? (Я попытался с помощью параметра «р», и это не то, что я ожидал)Обрезка дендрограммы на уровнях в Scipy Иерархическая кластеризация

Z = dendrogram(linkage_matrix, 
      truncate_mode='lastp', 
      color_threshold=1, 
      labels=df.session.tolist(), 
      distance_sort='ascending') 


plt.title("Hierachical Clustering") 
plt.show() 

Results

ответ

0

Как указано в the scipy documentation, если узел кластера находится под color_threshold, то все его потомки будет иметь тот же цвет (не синий). Соединения, соединяющие узлы выше color_threshold, будут синими.

В вашем примере color_threshold=1. Поскольку все узлы находятся выше 1, все ссылки являются синими.

Попробуйте вместо

Z = dendrogram(linkage_matrix, 
     color_threshold=1500, 
     distance_sort='ascending') 
Смежные вопросы