Я преобразовал свой набор данных в dataframe. Мне было интересно, как его использовать в scikit kmeans или в любом другом пакете kmeans.Как использовать Scikit kmeans, когда у меня есть dataframe
import csv
import codecs
import pandas as pd
import sklearn
from sklearn import cross_validation
from sklearn.cross_validation import train_test_split
sample_df = pd.read_csv('sample.csv',sep='\t',keep_default_na=False, na_values=[""])
print sample_df['Polarity']
print sample_df['Gravity']
print sample_df['Sense']
print sample_df[['Polarity','Gravity']]
sklearn.cluster.KMeans(n_clusters=8, init='k-means++', n_init=10, max_iter=300, tol=0.0001, precompute_distances='auto', verbose=0, random_ state=None, copy_x=True, n_jobs=1)
В дополнение к этой любезной помощи с поездом и испытанием. Заранее спасибо.
Спасибо человек .. Он работал. :) –
Добро пожаловать. Пожалуйста, не забудьте подтвердить и принять мой ответ, когда вы достигнете требуемой репутации. –
уже сделано .. Но wil будет отражено после достижения требуемой репутации .. :) –