Его явно не ковариация. Посмотрим, что это.
у-бар среднее y1 и y2:
> d=data.frame(y1=c(1,3,2,7),y2=c(2,4,5,2))
> ybar = mean(c(d$y1, d$y2))
> ybar
[1] 3.25
Теперь в вашей сумме мы имеем небольшую точку растерянность. A * A 'будет зависеть от того, является ли A матрицей строк или матрицей столбцов. R имеет только векторы в одном измерении. В одном направлении вы получите скалярный ответ, иначе вы получите матрицу 4x4, так как у вас есть четыре наблюдения. Я думаю, ты хочешь первого. Таким образом, внутренний бит вашей суммы есть суммы этих:
> t(d$y1-ybar) %*% (d$y1-ybar)
[,1]
[1,] 20.75
> t(d$y2-ybar) %*% (d$y2-ybar)
[,1]
[1,] 6.75
Сумма затем 20,75 + 6,75, который +27,5. Вот ваш ответ.
Но эти вещи не заботятся, являются ли они y1 или y2. Это всего лишь сумма квадратов от среднего. Мы можем получить вектор всех значений с помощью unlist
и работать с этим в одном:
> unlist(d)
y11 y12 y13 y14 y21 y22 y23 y24
1 3 2 7 2 4 5 2
> sum((unlist(d) - mean(unlist(d)))^2)
[1] 27.5
и есть ваш ответ снова.
Что вы ** ** ** пробовали? – Spacedman
Я пробовал функции «cov» и «var», но я получаю разные вещи, и поиск в Google я не нашел разницы между этими двумя :(В худшем случае я думал о кодировании adhoc, но я считаю, что это неприемлемо, если R уже имеет функцию для этого – Martingalo
Итак, у вас есть имя для того, что, по вашему мнению, вызывается этим вычислением? Является ли y-bar в формуле средним значением y1 и y2? – Spacedman