2013-02-14 5 views
0

Я выполняю тест на оценку ранга Уилкоксона по моим данным. Данные имеют разные единицы измерения и в основном разные шкалы. Нужно ли вводить эту команду перед запуском теста?Нужно ли масштабировать перед проведением теста Wilcoxon?

## where x is my data frame 
scale(x, center = TRUE, scale = TRUE) 

или же сумма баллов по критерию оценки Уилкоксона по сути делает это?

ответ

4

Вы не можете масштабировать, потому что Wilcoxon - это тест местоположения (по умолчанию в R есть mu = 0), и если вы масштабируете свои данные, вы потеряете истинную информацию о местоположении.

> x <- rnorm(100,700,20) 
> 
> wilcox.test(x) # Mu = 0 

     Wilcoxon signed rank test with continuity correction 

data: x 
V = 5050, p-value < 2.2e-16 
alternative hypothesis: true location is not equal to 0 

> wilcox.test(x,mu=mean(x)) 

     Wilcoxon signed rank test with continuity correction 

data: x 
V = 2650, p-value = 0.6686 
alternative hypothesis: true location is not equal to 697.4377 

> wilcox.test(scale(x)) # Mu = 0 

     Wilcoxon signed rank test with continuity correction 

data: scale(x) 
V = 2650, p-value = 0.6686 
alternative hypothesis: true location is not equal to 0 
+0

Прохладный Я понимаю, что вы здесь сделали, хотя есть вопрос на мой взгляд, сравнивая значение V между 1-м и 3-м тестом, которые вы выполнили. Было ли значение V уменьшено, потому что значения в матрице x были ближе друг к другу после масштабирования? – Error404

+1

Значение V уменьшилось, поскольку «реальное» («реальное», потому что оно после масштабирования) приблизилось к значению mu. В первом случае мы имеем место, равное 697,43, а mu равно 0, а третье местоположение AND mu равно 0. Второе место у нас есть, а mu - 697,43, поэтому он дал то же значение V третьего теста (в обоих тестах mu и location имеют одинаковое расстояние, 0). – Rcoster

+0

сверкающий прозрачный, приветствия :) – Error404