2016-02-21 2 views
5

Я хочу оценить модель экспоненциальных опасностей с одним предсказателем в R. По какой-то причине я получаю коэффициенты с противоположными знаками, когда оцениваю их с помощью glm poisson со сдвигом log t и когда я просто использую функцию останова из пакета выживания. Я уверен, что объяснение совершенно очевидно, но я не могу понять это.Противоположные направления коэффициентов экспоненциальной модели опасности (с использованием суррега и glm poisson)

Пример

t <- c(89,74,23,74,53,3,177,44,28,43,25,24,31,111,57,20,19,137,45,48,9,17,4,59,7,26,180,56,36,51,6,71,23,6,13,28,16,180,16,25,6,25,4,5,32,94,106,1,69,63,31) 
d <- c(0,1,1,0,1,1,0,1,1,0,1,1,1,1,0,0,1,0,1,1,1,0,1,0,1,1,0,0,1,1,1,1,1,1,1,1,1,0,1,1,1,1,1,1,1,0,1,1,1,1,1) 
p <- c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,1,1,1) 
df <- data.frame(d,t,p) 

# exponential hazards model using poisson with offest log(t) 
summary(glm(d ~ offset(log(t)) + p, data = df, family = "poisson")) 

Производит:

Coefficients: 
      Estimate Std. Error z value Pr(>|z|)  
(Intercept) -5.3868  0.7070 -7.619 2.56e-14 *** 
p    1.3932  0.7264 1.918 0.0551 . 

По сравнению с

# exponential hazards model using survreg exponential 
require(survival) 
summary(survreg(Surv(t,d) ~ p, data = df, dist = "exponential")) 

Выдает:

  Value Std. Error  z  p 
(Intercept) 5.39  0.707 7.62 2.58e-14 
p   -1.39  0.726 -1.92 5.51e-02 

Почему коэффициенты в противоположных направлениях и как я буду интерпретировать результаты, когда они стоят? Спасибо!

+0

Итак, я начинаю понимать, что читаю [это] (http://www.math.ku.dk/~richard/courses/regression2014/survival.html). В то время как модель Пуассона оценивает опасности, модель survreg представляет собой ускоренную модель времени отказа. Поскольку я использую экспоненциальную модель, а не Вейбулл, коэффициенты точно такие же, как и в противоположных направлениях. Тем не менее, я все еще говорю о интерпретации. – fmerhout

+2

Это легко. Ответные переменные в двух моделях различны. Для Пуассона вы моделируете количество событий/статус событий (только с 0-1), таким образом, коэф, как «риск» или «опасность», в то время как в 'survreg' вы моделируете время, поэтому коэффициент равен« выживанию »(log time ratio), что отрицательно коррелирует с «риском». Это повышает риск/опасность, тем меньше время выживания. – Eric

ответ

0

Во второй модели увеличенное значение p связано со снижением ожидаемой выживаемости. В первой модели увеличенный p, который имел большую величину t, означал бы более высокий шанс на выживание и более низкий риск. Вариации риска и средних значений времени выживания неизбежно идут в противоположных направлениях. Тот факт, что абсолютные значения совпадают, исходит из математического лога (1/x) = -log (x). Риск (точно) обратно пропорционален среднему времени жизни в экспоненциальных моделях.

+0

Спасибо, это именно то, что я искал. Конечно, некоторый кредит должен также пойти на @ Eric, который первым предложил этот ответ - просто не как ответ. – fmerhout

+0

Вы также можете посмотреть: 'summary (survreg (Surv (t, d) ~ p, data = df, dist =" weibull ", scale = 1))' и обратите внимание на комментарий в разделе примеров '? Survreg' –

Смежные вопросы