2015-11-12 2 views

ответ

0

какой бы ни придерживался установленный прямой красная линия хорошо, т.е. изменять синхронизацию друг с другом. Например mpg ~ wt один (5-й по 1-й строке).

Иногда, если точки лежат близко к линии, но линия искривлена ​​(например, дисп ~ вес), это хорошая нелинейная связь и один по-прежнему могут быть определены другие, но если вы вычислить коэффициент корреляции это будет быть маленьким.

+0

Пожалуйста, покажите, какие переменные коррелируют в этом графике и как? –

+0

Не обязательно, чтобы они соответствовали прямой линии. Фактически 'disp ~ wt' имеет более высокий коэффициент корреляции, чем' mpg ~ wt'. > кор (mtcars $ дисп, mtcars $ мас) [1] 0,8879799 > кор (mtcars $ миль на галлон, mtcars $ мас) [1] -0,8676594 –

4

Если вы хотите знать коэффициент корреляции напрямую, пользователь pairs.panels функционирует от psych.

library(psych) 
pairs.panels(mtcars[,1:6]) 

Этот участок предоставляет больше информации о данных, чем pairs. Output

+0

Так какие переменные являются наиболее коррелируют в соответствии с этим сюжетом? –

+0

@PankajSharma Переменные отмечены по диагонали, разброс участков в нижнем треугольнике и коэффициенты корреляции в верхнем треугольнике. Таким образом, используя матричную нотацию, для переменных «A [i, i]» и «A [j, j]», соответствующий график рассеяния является «A [j, i]», а коэффициент корреляции - «A [i, j]' , Учитывая эту информацию, вы можете выяснить, какие две переменные наиболее коррелированы? –

7

Еще один вариант должен был бы использовать корреляционную матрицу, а затем построить его с помощью corrplot пакета:

require(corrplot) 
corrplot.mixed(cor(mtcars),tl.col='black') 

enter image description here

Вы можете увидеть коэффициенты корреляции и таким образом найти коррелированные переменные.

Вы также можете использовать PerformanceAnalytics пакет:

require(PerformanceAnalytics) 
chart.Correlation(mtcars,hist=T) 

Вы можете увидеть гистограммы значений, линии, как в функции pairs, коэффициенты корреляции и уровни значимости.

enter image description here

+0

Итак, какие переменные соотносятся друг с другом в соответствии с этим графиком? –

+0

cyl и disp имеют коэффициент корреляции 0,9, поэтому они хорошо коррелированы. mpg и wt имеют коэффициент -0,87, поэтому они отрицательно коррелируют. Чем ближе к 1 или -1, тем выше корреляция – etienne

+0

Thankyou @ etienne –

0
library(dplyr) 
library(reshape2) 
d_cor <- as.matrix(cor(mtcars[,1:6])) 
d_cor_melt <- arrange(melt(d_cor), -abs(value)) 
thresold = 0.7 
filter(d_cor_melt, abs(value) > thresold & value !=1) 

enter image description here

Смежные вопросы