2014-09-11 3 views
0

Я ищу метод для выполнения тестов ANOVA и HSD из фреймворка данных в Python. Я попытался прочитать несколько примеров на форумах и учебниках, но я не смог применить его к своей работе.ANOVA и HSD тесты из Python dataframe

Вот простой Панды dataframe:

Date Density Hour Repetition Glucose 
A HD  AM 1   6.7 
A HD  AM 2   6.8 
A HD  PM 2   9.6 
A HD  PM 3   11.9 
B HD  AM 1   23 
B HD  AM 2   18.1 
B HD  PM 1   43.3 
B HD  PM 2   32 
C HD  AM 1   5.1 
C HD  AM 2   3.8 
C HD  PM 1   5.2 
C HD  PM 2   5.5 

Как я мог выполнить ANOVA, а затем тест на HSD, чтобы проверить действие Дата, плотности и час на Глюкоза? Я попытался с этими библиотеками:

from scipy.stats import f_oneway 
from statsmodels.stats.multicomp import pairwise_tukeyhsd 

, но я не могу добиться, чтобы применить их к моему примеру

Спасибо авансом

ответ

0

pairwise_tukeyhsd только позволяет одной переменной группы, то для OneWay ANOVA. Можно сделать все парные сравнения для всех полностью взаимодействующих групп после создания группового индекса для всех разных объясняющих переменных. Например, group1 = (A, HD, AM, 1), group2 = (A, HD, AM, 2) и так далее.

Для парного сравнения только для некоторых эффектов нам потребуется парное сравнение после оценки многоканального ANOVA с OLS. В настоящее время это недоступно в statsmodels. Критические значения и p-значения Tukey-HSD в этом случае не будут применяться.

В этом случае можно было бы оценить полную модель с помощью OLS, определить все требуемые парные контрасты, использовать t_test для получения необработанных p-значений для сравнений, а затем применить одно из нескольких значений p исправления, которые доступны.

Смежные вопросы