2015-10-09 3 views
0

В R есть есть 2 векторовНайти запись, которая вызывает низкое значение р

u <- c(109, 77, 57, 158, 60, 63, 42, 20, 139, 15, 64, 18) 
v <- c(734, 645, 1001, 1117, 1071, 687, 162, 84, 626, 64, 218, 79) 

Я хочу проверить H: u и v независимы, так я бегу хи-квадрат тест:

chisq.test(as.data.frame(rbind(u,v)) ) 

и получите очень низкое значение p, означающее, что я могу отклонить H, что означает, что u и v не являются независимыми.

Но когда я печатаю

chisq.test(u,v) 

Я получаю р-значение на 0.23, который означает, что я могу принять H. Какой из этих двух испытаний должен я выбрал?

Кроме того, я хочу найти записи в этих векторах, которые вызывают это низкое значение p. Есть идеи, как это сделать?

+2

Очевидно, что вторая правильная 'chisq.test (u, v)'. Если вы предоставляете только файл data.frame, выполняется проверка на соответствие требованиям, а df рассматривается как таблица непредвиденных обстоятельств. Проверьте '? Chisq.test'. – LyzandeR

+0

Hum, 121 df кажется большой ценой для проверки распределения 2x12 номеров. Возможно, 'chisq.test (u, p = v, rescale.p = TRUE)'? Как вы думаете, @LyzandeR? –

+0

Привет @ RomanLuštrik. Я определенно согласен, что 121 градус свободы - это большая цена, которую нужно заплатить при проверке независимости двух очень маленьких векторов. Теперь, если вы выполняете 'chisq.test (u, p = v, rescale.p = TRUE)', вы не выполняете тест на пригодность, который немного отличается от проверки независимости? Кажется, это поддерживает [это] (http://www.coastal.edu/kingw/statistics/R-tutorials/goodness.html), но я могу ошибаться. – LyzandeR

ответ

0

В тестовой статистике используется сумма квадратов стандартизованных остатков. Вы можете посмотреть эти значения, чтобы получить представление о важности конкретных значений.

m = chisq.test(u, v) 

residuals(m) 
m$stdres 
+0

Так считаются остатки с высоким абсолютным значением shoud и как это можно решить? –

Смежные вопросы