2015-03-25 2 views
0

Как отображать попарные отношения между переменными, если «UniqueCarrier» является символом, а «Задержка» содержит 0 и 1?Как отобразить попарно связь между переменными в R?

plot(Delay ~ UniqueCarrier, data = mydata) 
+2

Первичный вопрос не требует работа мозга, хотя ответ на этот вопрос, кажется, требует слишком много работы мозга;) –

ответ

3

Мы можем использовать barplot следующим образом, чтобы показать отсчеты 1 для каждого уникального значения символа переменной

# Generate sample data 
uniqueCarrier <- unlist(lapply(1:10, function(i) rep(paste(sample(letters,size = 3), collapse=""),10))) 
Delay <- rbinom(100, 1, prob = rep(c(.30, .2, .1, .5, .7, .6, .9, .2, .7, .6),each = 10)) 

# Create the plot 
barplot(by(data = Delay, INDICES = uniqueCarrier, sum), cex.names = 0.9) 

enter image description here

данных генерируется

> dput(uniqueCarrier) 
c("ekp", "ekp", "ekp", "ekp", "ekp", "ekp", "ekp", "ekp", "ekp", 
"ekp", "vtq", "vtq", "vtq", "vtq", "vtq", "vtq", "vtq", "vtq", 
"vtq", "vtq", "jic", "jic", "jic", "jic", "jic", "jic", "jic", 
"jic", "jic", "jic", "sab", "sab", "sab", "sab", "sab", "sab", 
"sab", "sab", "sab", "sab", "ekl", "ekl", "ekl", "ekl", "ekl", 
"ekl", "ekl", "ekl", "ekl", "ekl", "ifx", "ifx", "ifx", "ifx", 
"ifx", "ifx", "ifx", "ifx", "ifx", "ifx", "miw", "miw", "miw", 
"miw", "miw", "miw", "miw", "miw", "miw", "miw", "oif", "oif", 
"oif", "oif", "oif", "oif", "oif", "oif", "oif", "oif", "qto", 
"qto", "qto", "qto", "qto", "qto", "qto", "qto", "qto", "qto", 
"vqw", "vqw", "vqw", "vqw", "vqw", "vqw", "vqw", "vqw", "vqw", 
"vqw") 
> dput(Delay) 
c(1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 1L, 0L, 0L, 
0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 
1L, 1L, 0L, 1L, 1L, 1L, 1L, 1L, 0L, 1L, 0L, 0L, 1L, 1L, 0L, 0L, 
1L, 1L, 1L, 1L, 1L, 0L, 0L, 0L, 1L, 0L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L, 1L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 1L, 0L, 
0L, 1L, 0L, 1L, 0L, 0L, 0L, 0L, 1L, 1L, 0L, 0L, 1L, 0L, 1L, 0L, 
1L, 1L, 0L, 1L, 0L) 
+0

Если я запустил это: barplot (by (data = mydata $ Delay, INDICES = mydata $ UniqueCarrier, sum), axes = TRUE, cex.names = 0.9) , то я получаю эту ошибку: «сумма» не определена для упорядоченных факторов. Дело в том, что «Задержка» - это упорядоченный фактор. –

+0

Затем вы можете использовать 'as.numeric (Delay) -1', чтобы использовать его численное представление (если коэффициент уровня 1 является фактическим нулем, а коэффициент уровня 2 равен единице). –

+0

Теперь это работает! Благодарю. –

Смежные вопросы