2017-02-10 4 views
3

В моем наборе данных у меня есть 15 наблюдений, и я хочу проверить, может ли это распределение быть представлено экспоненциальным распределением со скоростью = 0,54. Переменная х выглядит следующим образом:Как использовать критерий Ки-квадрат для экспоненциального распределения в R

table(x) 
x 
0 1 2 4 5 7 8 10 
2 1 4 2 2 2 1 1 

Любая идея, как реализовать это в R?

+1

Это не DUP @akrun, по крайней мере, ссылка, которую вы указали, не использует критерий хи-квадрат, чтобы определить, извлекаются ли данные из определенного дистрибутива. –

+2

@akrun Извините, но я не думаю, что это дублированный вопрос! Пожалуйста, внимательно прочитайте вопрос. – brock

+0

@SandipanDey Это кто-то еще перенаправил ссылку на dupe и пометил ее. Вот и все – akrun

ответ

1

Мы можем попробовать что-то вроде

set.seed(1) 
observed <- c(2, 1, 4, 2, 2, 2, 1, 1) 
prob.exp <- dexp(c(0, 1, 2, 4, 5, 7, 8, 10), rate=0.54) # prob for the exp dist. variable for the values 
chisq.test(observed, p=prob.exp, rescale.p = TRUE) 
#X-squared = 73.523, df = 7, p-value = 2.86e-13 

Мы можем попробовать это также (с теоретического определения):

set.seed(1) 
observed <- c(2, 1, 4, 2, 2, 2, 1, 1) 
prob.exp <- dexp(c(0, 1, 2, 4, 5, 7, 8, 10), rate=0.54) 
prob.exp <- prob.exp/sum(prob.exp) # normalize 
expected <- sum(observed)*prob.exp 
# expected frequency of the values 
chisq.stat <- sum((observed-expected)^2/expected) 
# [1] 73.52297 
1-pchisq(sum(chisq.stat),df=8-1) 
# [1] 2.859935e-13 

Они точно дают тот же результат, как и ожидалось (нулевую гипотезу СОГЛАСИИ тест отклоняется, поэтому данные не относятся к распределению)

1

Вы можете протестировать для ссылки на журнал (т.е. экспоненциальное распределение на измеренном уровне) между числовые «имена» и наблюдаемые значения этой таблицы значений со смещением log (rate). Если добавление смещение журнала (скорость) имеет перехватывать значительно отличается от 0, то конкретная гипотеза отвергается (и это ... нет):

summary(glm(vals ~ nm+offset(rep(0.54, 8)) ,family=poisson)) 

Call: 
glm(formula = vals ~ nm + offset(rep(0.54, 8)), family = poisson) 

Deviance Residuals: 
    Min  1Q Median  3Q  Max 
-0.9762 -0.3363 -0.1026 0.1976 1.1088 

Coefficients: 
      Estimate Std. Error z value Pr(>|z|) 
(Intercept) 0.36468 0.40787 0.894 0.371 
nm   -0.06457 0.08027 -0.804 0.421 

(Dispersion parameter for poisson family taken to be 1) 

    Null deviance: 3.3224 on 7 degrees of freedom 
Residual deviance: 2.6593 on 6 degrees of freedom 
AIC: 26.38 

Number of Fisher Scoring iterations: 4 
Смежные вопросы