Scikit имеет CalibratedClassifierCV, что позволяет нам откалибровать наши модели на определенной паре X, y. В нем также четко указано, что data for fitting the classifier and for calibrating it must be disjoint.
Scikit правильный способ откалибровки классификаторов с помощью CalibratedClassifierCV
Если они должны быть непересекающимися, можно ли обучать классификатор следующим образом?
model = CalibratedClassifierCV(my_classifier)
model.fit(X_train, y_train)
Я боюсь, что с помощью того же набора обучения я разорвать disjoint data
правило. Альтернативой может быть наличие валидации
my_classifier.fit(X_train, y_train)
model = CalibratedClassifierCV(my_classifier, cv='prefit')
model.fit(X_valid, y_valid)
У кого есть недостаток в том, чтобы оставлять меньше данных для обучения. Кроме того, если CalibratedClassifierCV должен соответствовать только моделям, установленным на другом учебном наборе, почему бы его использовать по умолчанию: cv=3
, который также будет соответствовать базовой оценке? Проверяет ли перекрестная проверка правильное правило непересекающегося?
Вопрос: Каков правильный способ использования CalibratedClassifierCV?