У меня есть простая модель GLM выглядит как:предсказывали вероятность использования логистической регрессии в R равен 1
glm.fit=glm(Retention2~Email+Pay.method, data=train, family = binomial)
Все DV и капельницы являются категориальными переменными с двумя уровнями.
Исход glm
является:
, когда я вычислил вероятность основывается, значение вероятности 1.000, когда Pay.Method равно 0. Синтаксис и выход приведен ниже:
glm.fit.prob=predict(glm.fit, newdata = test2, type="response")
кажется, что всякий раз, когда pay.method ="EZ PAY"
, вероятность будет равна 0. Я думаю, математически причина в том, что coeff
электронной почты настолько меньше, чем перехват и Pay.method. Интересно, правильно ли я понимаю, и если да, то какое представление о том, как обойти это?
спасибо! это дало мне лучшую форму, хотя и не так хорошо, как использование LDA. – YLS