Технически это не проблема программирования, а математическая проблема. Но я думаю, вам лучше использовать дисперсионно-ковариационную матрицу. Или корреляционная матрица, если масштаб значения сильно отличаются, скажем, вместо того, чтобы:
>>> x
array([[5, 3, 0],
[3, 0, 5],
[5, 5, 0],
[1, 1, 7]])
У вас есть:
>>> x
array([[5, 300, 0],
[3, 0, 5],
[5, 500, 0],
[1, 100, 7]])
Чтобы получить матрицу дисперсии-коронавирус:
>>> np.cov(x)
array([[ 6.33333333, -3.16666667, 6.66666667, -8. ],
[ -3.16666667, 6.33333333, -5.83333333, 7. ],
[ 6.66666667, -5.83333333, 8.33333333, -10. ],
[ -8. , 7. , -10. , 12. ]])
Или корреляционная матрица:
>>> np.corrcoef(x)
array([[ 1. , -0.5 , 0.91766294, -0.91766294],
[-0.5 , 1. , -0.80295507, 0.80295507],
[ 0.91766294, -0.80295507, 1. , -1. ],
[-0.91766294, 0.80295507, -1. , 1. ]])
Это способ взглянуть на него, диагональная ячейка, т. Е. Ячейка (0,0)
, является корреляцией вашего 1-го вектора в X с ней, поэтому она равна 1. Другие ячейки, то есть ячейка (0,1)
, является корреляцией между 1-й и 2-й векторы в X. Они отрицательно коррелированы. Или аналогично 1-я и 3-я ячейки положительно коррелируют.
Ковариационная матрица или матрица корреляции исключают нулевую проблему, отмеченную @Akavall.
Я думаю, что ковариационный подход лучше моего решения. – Akavall