В R есть есть 2 векторовНайти запись, которая вызывает низкое значение р
u <- c(109, 77, 57, 158, 60, 63, 42, 20, 139, 15, 64, 18)
v <- c(734, 645, 1001, 1117, 1071, 687, 162, 84, 626, 64, 218, 79)
Я хочу проверить H: u
и v
независимы, так я бегу хи-квадрат тест:
chisq.test(as.data.frame(rbind(u,v)) )
и получите очень низкое значение p, означающее, что я могу отклонить H, что означает, что u
и v
не являются независимыми.
Но когда я печатаю
chisq.test(u,v)
Я получаю р-значение на 0.23, который означает, что я могу принять H. Какой из этих двух испытаний должен я выбрал?
Кроме того, я хочу найти записи в этих векторах, которые вызывают это низкое значение p. Есть идеи, как это сделать?
Очевидно, что вторая правильная 'chisq.test (u, v)'. Если вы предоставляете только файл data.frame, выполняется проверка на соответствие требованиям, а df рассматривается как таблица непредвиденных обстоятельств. Проверьте '? Chisq.test'. – LyzandeR
Hum, 121 df кажется большой ценой для проверки распределения 2x12 номеров. Возможно, 'chisq.test (u, p = v, rescale.p = TRUE)'? Как вы думаете, @LyzandeR? –
Привет @ RomanLuštrik. Я определенно согласен, что 121 градус свободы - это большая цена, которую нужно заплатить при проверке независимости двух очень маленьких векторов. Теперь, если вы выполняете 'chisq.test (u, p = v, rescale.p = TRUE)', вы не выполняете тест на пригодность, который немного отличается от проверки независимости? Кажется, это поддерживает [это] (http://www.coastal.edu/kingw/statistics/R-tutorials/goodness.html), но я могу ошибаться. – LyzandeR