Я получил диаграмму пар из набора данных mtcars. Как понять, какие переменные связаны друг с другом?
Как узнать из этого параграфа, какие переменные более взаимосвязаны друг с другом?
Я получил диаграмму пар из набора данных mtcars. Как понять, какие переменные связаны друг с другом?
Как узнать из этого параграфа, какие переменные более взаимосвязаны друг с другом?
какой бы ни придерживался установленный прямой красная линия хорошо, т.е. изменять синхронизацию друг с другом. Например mpg ~ wt один (5-й по 1-й строке).
Иногда, если точки лежат близко к линии, но линия искривлена (например, дисп ~ вес), это хорошая нелинейная связь и один по-прежнему могут быть определены другие, но если вы вычислить коэффициент корреляции это будет быть маленьким.
Если вы хотите знать коэффициент корреляции напрямую, пользователь pairs.panels
функционирует от psych
.
library(psych)
pairs.panels(mtcars[,1:6])
Этот участок предоставляет больше информации о данных, чем pairs
.
Так какие переменные являются наиболее коррелируют в соответствии с этим сюжетом? –
@PankajSharma Переменные отмечены по диагонали, разброс участков в нижнем треугольнике и коэффициенты корреляции в верхнем треугольнике. Таким образом, используя матричную нотацию, для переменных «A [i, i]» и «A [j, j]», соответствующий график рассеяния является «A [j, i]», а коэффициент корреляции - «A [i, j]' , Учитывая эту информацию, вы можете выяснить, какие две переменные наиболее коррелированы? –
Еще один вариант должен был бы использовать корреляционную матрицу, а затем построить его с помощью corrplot
пакета:
require(corrplot)
corrplot.mixed(cor(mtcars),tl.col='black')
Вы можете увидеть коэффициенты корреляции и таким образом найти коррелированные переменные.
Вы также можете использовать PerformanceAnalytics
пакет:
require(PerformanceAnalytics)
chart.Correlation(mtcars,hist=T)
Вы можете увидеть гистограммы значений, линии, как в функции pairs
, коэффициенты корреляции и уровни значимости.
Итак, какие переменные соотносятся друг с другом в соответствии с этим графиком? –
cyl и disp имеют коэффициент корреляции 0,9, поэтому они хорошо коррелированы. mpg и wt имеют коэффициент -0,87, поэтому они отрицательно коррелируют. Чем ближе к 1 или -1, тем выше корреляция – etienne
Thankyou @ etienne –
Пожалуйста, покажите, какие переменные коррелируют в этом графике и как? –
Не обязательно, чтобы они соответствовали прямой линии. Фактически 'disp ~ wt' имеет более высокий коэффициент корреляции, чем' mpg ~ wt'. > кор (mtcars $ дисп, mtcars $ мас) [1] 0,8879799 > кор (mtcars $ миль на галлон, mtcars $ мас) [1] -0,8676594 –