Мне интересно, как использовать перекрестную проверку в python для повышения точности моей модели регрессии логистики. Используемый набор данных называется «радужка». Я уже успешно использовал перекрестное подтверждение для модели SVM, но я изо всех сил пытаюсь настроить мой код, чтобы сделать то же самое для модели логистической регрессии. Вот мой код до сих пор:Проверка переходов для логистической регрессии
from sklearn import cross_validation
from sklearn import datasets, linear_model
iris = datasets.load_iris()
x_iris = iris.data
y_iris = iris.target
svc = svm.SVC(C=1, kernel='linear')
k_fold = cross_validation.StratifiedKFold(y_iris, n_folds=10)
# labels, the number of folders
#for train, test in k_fold:
# print train, test
scores = cross_validation.cross_val_score(svc, x_iris, y_iris, cv=k_fold, scoring='accuracy')
# clf.fit() is repeatedly called inside the cross_validation.cross_val_score()
print scores
print 'average score = ', np.mean(scores)
print 'std of scores = ', np.std(scores)
Какие изменения я должен сделать, чтобы код, чтобы добиться успешной проверки кросс для моей модели логистической регрессии?
Спасибо за любую помощь.
дайте мне знать, если мой ответ снизу соответствует вашим потребностям, в противном случае я постараюсь посмотреть, что именно вы хотите, ура! –