2013-12-12 2 views
0

У меня есть кадр данных с 36 переменными и 74 наблюдениями. Я хотел бы сделать два образца парных ttest из 35 переменных по 1 группе (с двумя уровнями).Т-тест с переменной группировки

Например: кадр данных содержит «возраст» «вес тела» и «групповые» переменные. Теперь я предполагаю, что я могу сделать ТТЕСТ для каждой переменной с этим кодом:

t.test(age~group)

Но есть способ проверить все 35 переменных с одним кодом, а не один за другим?

+1

Пожалуйста, отправьте воспроизводимый пример. –

+0

вы могли бы петлить/* накладывать на каждый столбец ... – EDi

+0

Существует способ, но это НЕ с 't.test'. Прочитайте несколько сравнений. Если у вас нет знаний о доменах об отношениях «группы» с этими переменными, тогда исследовательский анализ может быть выполнен с помощью двоичной логистической регрессии, но старайтесь избегать пошаговых процедур, которые поощряют SAS и SPSS. –

ответ

5

Пример кадра данных:

dat <- data.frame(age = rnorm(10, 30), body = rnorm(10, 30), 
        weight = rnorm(10, 30), group = gl(2,5)) 

Вы можете использовать lapply:

lapply(dat[1:3], function(x) 
        t.test(x ~ dat$group, paired = TRUE, na.action = na.pass)) 

В приведенной выше команде, 1:3 представляет число столбцов, включая переменные. Аргумент paired = TRUE необходим для выполнения парного t-теста.

+0

Два вопроса: Вы тестировали этот код с группами неравного размера? Почему это можно считать «парным» тестом? –

+0

@DWin 1) Да, я проверил код. 2) ОП попросил провести парный тест. Я не знаю фактического значения переменной 'group', используемой здесь. –

+0

@DWin BTW: Я согласен с тем, что t-тест не подходит для описанной задачи. К сожалению, ОП не уточнил значение «группы» и гипотез. –

3

Sven предоставил вам отличный способ реализовать то, что вы хотели реализовать. Я, однако, хочу предупредить вас о статистическом аспекте того, что вы делаете.

Напомним, что если вы используете стандартный уровень достоверности 0,05, это означает, что для каждого выполненного t-теста у вас есть 5% -ный шанс совершить ошибку типа 1 (неверное отклонение нулевой гипотезы). По законам вероятность, бег 35 индивидуальных т-тестов соединение вашей вероятности совершения типа 1 ошибка с коэффициентом 35, а точнее:

Pr (тип 1 ошибка) = 1 - (0,95)^35 = 0,834

Это означает, что у вас есть вероятность 83.4% ложного отказа от нулевой гипотезы. В основном это означает, что при запуске большого количества T-тестов существует очень высокая вероятность того, что хотя бы один из ваших T-тестов будет давать неверный результат.

Just FYI.

+0

хороший комментарий, плохой ответ. – C8H10N4O2

+4

Слишком большой для комментариев, и очень важно для тех, кто читает эту тему. +1 –

Смежные вопросы