2016-06-28 2 views
1

есть ли что-то, что делает многомерную иерархическую кластеризацию?многомерная иерархическая кластеризация - python

Я посмотрел в этих местах:

, но без успеха до сих пор

смысл: найти группы так же, как было выполненный с 2-мя размерами, но с множеством е размеры

некоторый код:

import pandas as pd 
import numpy as np 
set_of_values = pd.DataFrame(
    [np.random.rand(10), 
    np.random.rand(10), 
    np.random.rand(10), 
    np.random.rand(10), 
    np.random.rand(10),], 
    index=['temp differential', 'power differential', 'cost', 'time','output'], 
    columns=range(10)).transpose() 
print(set_of_values) 

Я хотел бы, чтобы найти все кластеры для («Темп дифференциала», «сила дифференциального», «стоимость», «время», «выход»). не графически, поскольку это гиперплоскость. в идеале с выходом, подобным [всем группам]:

GROUP #1: (a,b,c,d,e), (a',b',c',d',e'), ... , (a'',b'',c'',d'',e'') 
... 
GROUP #n: ('a,'b,'c,'d,'e), ('a,'b,'c,'d,'e), ... , (''a,''b,''c,''d,''e) 

с учетом порогового значения для прогрессивной кластеризации. это выполнимо?

ответ

1

Вот краткий пример. Здесь это кластеризация 4 случайных величин с иерархической кластеризацией:

%matplotlib inline 
import matplotlib.pylab as plt 
import seaborn as sns 
import pandas as pd 
import numpy as np 

df = pd.DataFrame({"col" + str(num): np.random.randn(50) for num in range(1,5)}) 
sns.clustermap(df) 

enter image description here

Если вы обеспокоены тем, с пониманием дендрограммы связей и порогового, чтобы получить кластеры, инструмент Сиборна использует SciPy и this post было бы полезно.

Если вы хотите визуализировать это в пространстве, я бы рекомендовал использовать Principal Component Analysis и черчения PC1 против PC2 http://scikit-learn.org/stable/auto_examples/decomposition/plot_pca_iris.html

+0

Это было то, что Iwas ищет – Asher11

Смежные вопросы