2016-05-04 2 views
-1

Я хочу создать кластеры переменных в кадре данных pandas, как указано ниже.Переменная кластеризация в python

У меня есть 900 столбцов и 50000 записей.

Я хочу построить 50 кластеров из 900 столбцов.

Затем нужно узнать столбцы в каждом кластере.

Пожалуйста, помогите мне, если есть способ сделать это в python.

Благодаря

+0

Вы можете добавить [Minimal, полный и проверяемый пример] (http://stackoverflow.com/help/mcve)? – jezrael

+1

Stack Overflow - это сообщество, которое поможет вам отлаживать или улучшать существующий код. Не кодировать то, что вам нужно. См. Пакет pikon scikit-learn для вашей проблемы (а затем, если у вас возникли проблемы с созданием кода, вернитесь сюда, и мы будем рады вам помочь!) – ysearka

ответ

1

Я не эксперт кластеризации в питоне, но я предлагаю вам, во-первых решить, какой алгоритм вы хотите использовать, чтобы получить свои кластеры, а затем просто искать пример делать это в Python ,

(Посмотрите здесь: http://scikit-learn.org/stable/modules/clustering.html)

+0

Я попробовал для k средств. он работает с записями, а не по столбцам, поэтому я переношу свои данные, преобразую их в массив, а затем в матрицу, а затем использовал k. dataset_array = cluster_inputt.values ​​от sklearn.cluster import KMeans labels = list (km.labels_) len (метки) km = KMeans (n_clusters = 50) km.fit (мат), но не может отобразить результат с помощью столбцов и я не получаю хороший результат по сравнению с sas –

+0

Я хочу сделать разделяющую иерархию кластеризации, но этого не существует в python –

+0

Я все еще не эксперт, но я нашел это http://docs.scipy.org/doc/scipy/reference /cluster.hierarchy.html Разве это не полезно для вашей проблемы? Или ваша идея - получить что-то вроде дендрограммы и т. Д.? – LeoCella

Смежные вопросы