Я тестирование производительности логистической регрессии с использованием процедуры cv.glm Перекрёстной Проверки библиотеки загрузки в R.cv.glm Проблема с отсутствующими факторами R
Некоторые из моих предикторов являются факторами.
Когда я запускаю его я получаю следующее сообщение об ошибке:
Error in model.frame.default(Terms, newdata, na.action = na.action, xlev = object$xlevels)
factor color has new levels RED
Я думаю, я понимаю проблему. Может быть, я тренирую регрессионную модель на подмножестве наблюдений, в которых некоторые уровни факторной переменной отсутствуют. Если эта модель позже будет использоваться для новых наблюдений, включая невидимые уровни предикторной переменной, тогда она не знает, как себя вести.
Поскольку это выглядит как фундаментальная проблема с CV, я удивлен, что в документации библиотеки я не нашел упоминания.
Я был бы очень признателен за любые указатели.
Благодарим вас за комментарий. Чтобы быть ясным, вы предлагаете использовать пакет ipred для оценки ошибок вместо загрузочной библиотеки? – user695652