Как отображать попарные отношения между переменными, если «UniqueCarrier» является символом, а «Задержка» содержит 0 и 1?Как отобразить попарно связь между переменными в R?
plot(Delay ~ UniqueCarrier, data = mydata)
Как отображать попарные отношения между переменными, если «UniqueCarrier» является символом, а «Задержка» содержит 0 и 1?Как отобразить попарно связь между переменными в R?
plot(Delay ~ UniqueCarrier, data = mydata)
Мы можем использовать barplot
следующим образом, чтобы показать отсчеты 1 для каждого уникального значения символа переменной
# Generate sample data
uniqueCarrier <- unlist(lapply(1:10, function(i) rep(paste(sample(letters,size = 3), collapse=""),10)))
Delay <- rbinom(100, 1, prob = rep(c(.30, .2, .1, .5, .7, .6, .9, .2, .7, .6),each = 10))
# Create the plot
barplot(by(data = Delay, INDICES = uniqueCarrier, sum), cex.names = 0.9)
данных генерируется
> dput(uniqueCarrier)
c("ekp", "ekp", "ekp", "ekp", "ekp", "ekp", "ekp", "ekp", "ekp",
"ekp", "vtq", "vtq", "vtq", "vtq", "vtq", "vtq", "vtq", "vtq",
"vtq", "vtq", "jic", "jic", "jic", "jic", "jic", "jic", "jic",
"jic", "jic", "jic", "sab", "sab", "sab", "sab", "sab", "sab",
"sab", "sab", "sab", "sab", "ekl", "ekl", "ekl", "ekl", "ekl",
"ekl", "ekl", "ekl", "ekl", "ekl", "ifx", "ifx", "ifx", "ifx",
"ifx", "ifx", "ifx", "ifx", "ifx", "ifx", "miw", "miw", "miw",
"miw", "miw", "miw", "miw", "miw", "miw", "miw", "oif", "oif",
"oif", "oif", "oif", "oif", "oif", "oif", "oif", "oif", "qto",
"qto", "qto", "qto", "qto", "qto", "qto", "qto", "qto", "qto",
"vqw", "vqw", "vqw", "vqw", "vqw", "vqw", "vqw", "vqw", "vqw",
"vqw")
> dput(Delay)
c(1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 1L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
1L, 1L, 0L, 1L, 1L, 1L, 1L, 1L, 0L, 1L, 0L, 0L, 1L, 1L, 0L, 0L,
1L, 1L, 1L, 1L, 1L, 0L, 0L, 0L, 1L, 0L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 1L, 0L,
0L, 1L, 0L, 1L, 0L, 0L, 0L, 0L, 1L, 1L, 0L, 0L, 1L, 0L, 1L, 0L,
1L, 1L, 0L, 1L, 0L)
Если я запустил это: barplot (by (data = mydata $ Delay, INDICES = mydata $ UniqueCarrier, sum), axes = TRUE, cex.names = 0.9) , то я получаю эту ошибку: «сумма» не определена для упорядоченных факторов. Дело в том, что «Задержка» - это упорядоченный фактор. –
Затем вы можете использовать 'as.numeric (Delay) -1', чтобы использовать его численное представление (если коэффициент уровня 1 является фактическим нулем, а коэффициент уровня 2 равен единице). –
Теперь это работает! Благодарю. –
Первичный вопрос не требует работа мозга, хотя ответ на этот вопрос, кажется, требует слишком много работы мозга;) –