2016-07-26 7 views
0

Я выполняю выбор модели для кучи вложенных моделей с использованием функции anova() в R. Каждая последующая модель имеет добавление одного ковариата к предыдущей модели , Мне интересно, как выводится столбец logLik. Я понимаю, что это естественный логарифм чего-то (например, в модели ниже очень мало), но я не знаю точно что это логарифм. Является ли это оценкой максимального правдоподобия в этой модели, то есть единственным значением, или это результат умножения вероятностей многочисленных значений параметров? Извиняюсь, я знаю, что это довольно фундаментальная вещь, которую нужно знать.Какова ценность логарифмической вероятности, возвращаемой функцией anova()

Model df  AIC  BIC logLik Test L.Ratio p.value 
    1 11 1319.522 1353.349 -648.8     
    2 12 1320.547 1357.450 -648.3 1 vs 2 0.975 0.324 
    3 13 1314.144 1354.121 -644.1 2 vs 3 8.404 0.004 
    4 14 1314.880 1357.932 -643.4 3 vs 4 1.264 0.261 
    5 15 1316.872 1363.000 -643.4 4 vs 5 0.007 0.931 
    6 16 1318.314 1367.517 -643.2 5 vs 6 0.558 0.455 
    7 17 1320.067 1372.345 -643.0 6 vs 7 0.247 0.619 
+1

это может быть более подходящим для [CrossValidated] (http://stats.stackexchange.com) ... числа - это логарифмические вероятности (фактически технически логарифмически правдоподобие * плотности *) всего набора данных по каждой модели (в оценки максимального правдоподобия для этой модели); поскольку отдельные наблюдения считаются независимыми, вероятность каждой модели является результатом вероятности отдельных наблюдений или, что то же самое, лог-правдоподобие является суммой логарифмических правдоподобия отдельных наблюдений ... –

+0

Извините @ Бен Болкер, да, я знаю, что это скорее вопрос с CV. – llewmills

ответ

1

Числа в столбце logLik являются лог-правдоподобия (на самом деле технически логарифмического правдоподобия плотности) всего набора данных по каждой модели (на оценок максимального правдоподобия для этой модели); поскольку отдельные наблюдения считаются независимыми, вероятность каждой модели является продуктом вероятностей отдельных наблюдений или, что эквивалентно, логарифмическая правдоподобие является суммой логарифмических правдоподобия отдельных наблюдений ...

+0

Спасибо @Ben Bolker. Наконец-то я получаю ответ. И только для моего собственного назидания, как мы получаем вероятность каждого отдельного наблюдения? – llewmills

+1

зависит от типа модели. Если у вас есть, скажем, линейная модель с 'y = a + bx', тогда' dnorm (y, mean = a + b * x, sd = , log = TRUE) 'даст вам логарифмические правдоподобия (вы 'd также необходимо определить стандартное отклонение ). Тем не менее, модель не установлена. –

+0

, поэтому @Ben Bolker вероятность каждого наблюдения в образце получается путем включения значения этого наблюдения в нормальное распределение (в данном случае), форма которого определяется характеристиками всего образца (т. Е. Среднего значения выборки и sd) ? – llewmills

Смежные вопросы