В настоящее время я изучаю QDA и использую программное обеспечение R для анализа моих данных.Нормализация данных в R
данные были загружены из следующей ссылке:
https://www.kaggle.com/uciml/pima-indians-diabetes-database
Я хочу, чтобы проверить предположение QDA т.е. двух групп многомерный нормально распределены, следовательно, использовали следующую команду в R.
library(MVN)
group1 <- discrim[1:500, 1:8]
result<- mardiaTest(group1, qqplot = FALSE) #To check whether our data from group1 is MND
group2 <- discrim[501:765, 1:8]
result2 <- mardiaTest(group2, qqplot= TRUE)#To check whether our data from group2 is MND
Обе группы распределены неравномерно, поэтому я хочу нормализовать данные и закодировал ниже, чтобы нормализовать данные для первой группы.
x1bar <- t(t(as.vector(sapply(as.data.frame(group1),mean))))
x1bartilda<- (x1bar - mean(x1bar))/sd(x1bar)
Аналогично для group2, однако в виду вектор X для group1 не дали результата, который близок к 0.
Может кто-нибудь помочь мне, что это путь вперед, пожалуйста?
Что такое реальный вопрос? Использование среднего значения, выходящего за пределы группы для стандартизации переменной, не приведет к получению нулевого среднего результата ... – AlexR
Как я могу нормализовать свои данные и продолжить работу с qda по моим данным? –
Это зависит от фактического распределения данных и это вопрос, который лучше подходит для [stats.SE]. – AlexR