2015-01-09 4 views
0

Я пытаюсь сделать многочленный логит, а мои независимые переменные категоричны. У меня есть две категориальные переменные: edu1 для тех, кто имеет среднюю школу и edu2 для тех, кто имеет высшее образование. Переменные - это фиктивные переменные (edu1=1 обозначает тех, кто имеет высшее образование, edu1=0 без). Я хочу получить результаты, чтобы сравнить результаты с теми, кто имеет высшее образование. Однако, когда я делаю mlogit edu*, модель автоматически включает edu1 не edu2 в модель. Есть ли способ отменить это и включить edu2 и не включать edu 1 вместо этого?как регрессировать категориальные переменные в Stata

ответ

0

Вы не можете иметь оба в модели, если не сбросить константу. Google "фиктивная переменная ловушка", чтобы понять, почему. Вот пример:

. webuse sysdsn1, clear 
(Health insurance data) 

. recode male (0=1) (1=0), gen(female) 
(644 differences between male and female) 

. mlogit insure male female, nocons nolog 

Multinomial logistic regression     Number of obs =  616 
                Wald chi2(4) =  149.44 
Log likelihood = -553.40712      Prob > chi2  =  0.0000 

------------------------------------------------------------------------------ 
     insure |  Coef. Std. Err.  z P>|z|  [95% Conf. Interval] 
-------------+---------------------------------------------------------------- 
Indemnity | (base outcome) 
-------------+---------------------------------------------------------------- 
Prepaid  | 
     male | .3001046 .1703301  1.76 0.078 -.0337363 .6339455 
     female | -.1772065 .0968274 -1.83 0.067 -.3669847 .0125718 
-------------+---------------------------------------------------------------- 
Uninsure  | 
     male | -1.529395 .3059244 -5.00 0.000 -2.128996 -.9297944 
     female | -1.989585 .1884768 -10.56 0.000 -2.358993 -1.620177 
------------------------------------------------------------------------------ 

. mlogit insure male, nolog 

Multinomial logistic regression     Number of obs =  616 
                LR chi2(2)  =  6.38 
                Prob > chi2  =  0.0413 
Log likelihood = -553.40712      Pseudo R2  =  0.0057 

------------------------------------------------------------------------------ 
     insure |  Coef. Std. Err.  z P>|z|  [95% Conf. Interval] 
-------------+---------------------------------------------------------------- 
Indemnity | (base outcome) 
-------------+---------------------------------------------------------------- 
Prepaid  | 
     male | .477311 .1959283  2.44 0.015  .0932987 .8613234 
     _cons | -.1772065 .0968274 -1.83 0.067 -.3669847 .0125718 
-------------+---------------------------------------------------------------- 
Uninsure  | 
     male |  .46019 .3593233  1.28 0.200 -.2440708 1.164451 
     _cons | -1.989585 .1884768 -10.56 0.000 -2.358993 -1.620177 
------------------------------------------------------------------------------ 

Обратите внимание, что во втором описании, константа женского эффект и мужчины получают постоянный плюс мужской коэффициент. Это соответствует тому, что вы получаете, с приведенной выше константой.

Если у вас есть другие манекены в модели, все становится немного сложнее. Константа будет соответствовать всем пропущенным категориям из каждого набора фиктивных переменных.

Смежные вопросы