Мой файл csv содержит дискретные и непрерывные переменные, и я хотел бы найти «уравнение модели», которое объясняет мою непрерывную переменную (a) в соответствии с моими дискретными переменными (x, y, z); -> a = f (x, y, z). Проблема в том, что я пытаюсь использовать этот код, но он терпит неудачу. Когда я хочу увидеть результат печати ([f_value, p_value] stats.f_oneway = (x, y, z)), я получаю [nan, nan]. Выписка из моего кода:ANOVA in python
from numpy import (genfromtxt,hstack,arange)
#Pr linear regression
from scipy import stats
import scipy
#Pr ANOVA
from statsmodels.stats.multicomp import (pairwise_tukeyhsd,MultiComparison)
from pylab import savefig
from matplotlib.pyplot import (figure,setp)
fname="G:/table.csv"
my_data = genfromtxt(fname,delimiter=',')
#Transformation of file into table
x= my_data[:,3]
y= my_data[:,4]
z= my_data[:,6]
#one way anova
[f_value, p_value] = stats.f_oneway(x, y, z)
Я хочу оценить модель R = U + F (х, у, г) + е, где R (непрерывная переменная), и (константа), е (погрешность измерения). Я хочу иметь коэффициенты для того, как дискретные переменные влияют на мой непрерывный результат.
если кто-нибудь знает другой путь, пожалуйста, помогите мне, потому что я ищу в Интернете, но я нахожу statsmodels библио и SciPy, который используется для ANOVA, но я не знаю, как это сделать и как применять эти библиотеки. – salma