2016-04-24 3 views
0

Я реализовал PCA с помощью Naive Bayes, используя sklearn, и я оптимизировал количество компонентов PCA с помощью GridSearchCV.Как получить имена функций из результатов gridSearchCV

Я попытался выяснить имена функций лучшей оценки, но я не смог. Вот код, который я пробовал.

from sklearn.cross_validation import train_test_split 
features_train, features_test, labels_train, labels_test = \ 
train_test_split(features, labels, test_size=0.3, random_state=42) 
### A Naive Bayes classifier combined with PCA is used and its accuracy is tested 

pca = decomposition.PCA() 
#clf = GaussianNB() 
clf = Pipeline(steps=[('pca', pca), ('gaussian_NB', GaussianNB())]) 
n_components = [3, 5, 7, 9] 
clf = GridSearchCV(clf, 
         dict(pca__n_components=n_components)) 

# from sklearn.tree import DecisionTreeClassifier 
#clf = DecisionTreeClassifier(random_state=0, min_samples_split=20) 
clf = clf.fit(features_train, labels_train) 
features_pred = clf.predict(features_test) 
print "The number of components of the best estimator is ", clf.best_estimator_.named_steps['pca'].n_components 
print "The best parameters:", clf.best_params_ 
#print "The best estimator", clf.best_estimator_.get_params(deep=True).gaussian_NB 
# best_est = RFE(clf.best_estimator_) 
# print "The best estimator:", best_est 
estimator = clf.best_estimator_ 
print "The features are:", estimator['features'].get_feature_names() 

ответ

1

Вы, кажется, путает снижение размерности и показывает выбор. PCA - метод уменьшения размерности, он не выбирает функции, он ищет линейную проекцию с более низким размерностью. Ваши результирующие функции не являются вашими оригинальными - они являются линейными комбинациями этих. Таким образом, если ваши оригинальные функции были «ширина», «высота» и «возраст» после PCA до тусклого 2, вы получаете такие функции, как «0,4 * ширина + 0,1 * высота - 0,05 * возраст» и «0,3 * высота - 0,2 * ширина ».

+0

Я думаю, именно поэтому он не работает так, как я ожидаю. –

0

Кажется, что this answer может быть тем, что вам нужно. Он содержит действительно хороший и исчерпывающий пример!

Смежные вопросы