В следующем коде:Как использовать вывод GridSearchCV для предсказания scikit?
# Load dataset
iris = datasets.load_iris()
X, y = iris.data, iris.target
rf_feature_imp = RandomForestClassifier(100)
feat_selection = SelectFromModel(rf_feature_imp, threshold=0.5)
clf = RandomForestClassifier(5000)
model = Pipeline([
('fs', feat_selection),
('clf', clf),
])
params = {
'fs__threshold': [0.5, 0.3, 0.7],
'fs__estimator__max_features': ['auto', 'sqrt', 'log2'],
'clf__max_features': ['auto', 'sqrt', 'log2'],
}
gs = GridSearchCV(model, params, ...)
gs.fit(X,y)
Что следует использовать для предсказания?
gs
?gs.best_estimator_
? илиgs.best_estimator_.named_steps['clf']
?
В чем разница между этими 3?
еще раз спасибо @ Давид Мауст, это очень полезно – user308827