Я хочу оценить модель экспоненциальных опасностей с одним предсказателем в R. По какой-то причине я получаю коэффициенты с противоположными знаками, когда оцениваю их с помощью glm poisson со сдвигом log t и когда я просто использую функцию останова из пакета выживания. Я уверен, что объяснение совершенно очевидно, но я не могу понять это.Противоположные направления коэффициентов экспоненциальной модели опасности (с использованием суррега и glm poisson)
Пример
t <- c(89,74,23,74,53,3,177,44,28,43,25,24,31,111,57,20,19,137,45,48,9,17,4,59,7,26,180,56,36,51,6,71,23,6,13,28,16,180,16,25,6,25,4,5,32,94,106,1,69,63,31)
d <- c(0,1,1,0,1,1,0,1,1,0,1,1,1,1,0,0,1,0,1,1,1,0,1,0,1,1,0,0,1,1,1,1,1,1,1,1,1,0,1,1,1,1,1,1,1,0,1,1,1,1,1)
p <- c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,1,1,1)
df <- data.frame(d,t,p)
# exponential hazards model using poisson with offest log(t)
summary(glm(d ~ offset(log(t)) + p, data = df, family = "poisson"))
Производит:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -5.3868 0.7070 -7.619 2.56e-14 ***
p 1.3932 0.7264 1.918 0.0551 .
По сравнению с
# exponential hazards model using survreg exponential
require(survival)
summary(survreg(Surv(t,d) ~ p, data = df, dist = "exponential"))
Выдает:
Value Std. Error z p
(Intercept) 5.39 0.707 7.62 2.58e-14
p -1.39 0.726 -1.92 5.51e-02
Почему коэффициенты в противоположных направлениях и как я буду интерпретировать результаты, когда они стоят? Спасибо!
Итак, я начинаю понимать, что читаю [это] (http://www.math.ku.dk/~richard/courses/regression2014/survival.html). В то время как модель Пуассона оценивает опасности, модель survreg представляет собой ускоренную модель времени отказа. Поскольку я использую экспоненциальную модель, а не Вейбулл, коэффициенты точно такие же, как и в противоположных направлениях. Тем не менее, я все еще говорю о интерпретации. – fmerhout
Это легко. Ответные переменные в двух моделях различны. Для Пуассона вы моделируете количество событий/статус событий (только с 0-1), таким образом, коэф, как «риск» или «опасность», в то время как в 'survreg' вы моделируете время, поэтому коэффициент равен« выживанию »(log time ratio), что отрицательно коррелирует с «риском». Это повышает риск/опасность, тем меньше время выживания. – Eric