Прежде всего, я все еще новичок. Я пытаюсь интерпретировать и сделать стек бар участок с R. Я уже посмотрел на ряде ответов, но некоторые из них не были специфичными к моему делу и другим, я просто не понимаю:Наложение двумерного на несколько факторов в R
- https://stats.stackexchange.com/questions/31597/graphing-a-probability-curve-for-a-logit-model-with-multiple-predictors
- https://stats.stackexchange.com/questions/47020/plotting-logistic-regression-interaction-categorical-in-r
- Plot the results of a multivariate logistic regression model in R
у меня есть набор данных dvl
, который имеет пять столбцов, Variant, регион, время, Человек и PrecededByPrep. Я хотел бы сделать многомерное сравнение Варианта с другими четырьмя предикторами. Каждый столбец может иметь один из двух возможных значений:
- Вариант:
elk
илиieder
. - Регион =
VL
илиNL
. - Время:
time
илиno time
- лицо:
person
илиno person
- PrecededByPrep:
1
или0
Вот логистическая регрессия
Из ответов я понял, что библиотека ggplot2
может быть лучшая библиотека для рисования. Я прочитал его документацию, но для жизни меня не могу понять, как это сделать: как я могу получить сравнение Variant
с тремя другими факторами?
Мне потребовалось некоторое время, но я сделал что-то похожее в Photoshop, чтобы я хотел (вымышленные значения!).
Темно-серый/светло-серый: возможные значения Variant
оси у: частота ось х: каждый столбец, подразделяют на его возможные значения
Я знаю, что делать индивидуальные штриховые графики, both stacked and grouped, но в принципе я не знаю, как складывать, группировать графики. ggplot2
можно использовать, но если это можно сделать, я бы предпочел это.
Я думаю, что это можно рассматривать как образец данных, хотя я не совсем уверен. Я начинаю с R, и я читал о создании набора образцов.
t <- data.frame(Variant = sample(c("iedere","elke"),size = 50, replace = TRUE),
Region = sample(c("VL","NL"),size = 50, replace = TRUE),
PrecededByPrep = sample(c("1","0"),size = 50, replace = TRUE),
Person = sample(c("person","no person"),size = 50, replace = TRUE),
Time = sample(c("time","no time"),size = 50, replace = TRUE))
Я бы хотел, чтобы этот участок был эстетически приятным. То, что я имел в виду:
- цвета участка (т.е. для баров):
col=c("paleturquoise3", "palegreen3")
- Полужирный шрифт для метки оси
font.lab=2
но не для меток значений (например,'regionin bold, but
В.Л.and
NL` не выделены жирным шрифтом) #404040
как цвет для шрифта, оси и линии- Этикетки для осей: X:
factors
, у:frequency
Небольшие точки: наличие нескольких предикторов не делает ваш анализ «многомерным»; это было обычное использование в 1970-х годах, но больше не было. Я редактировал «двухвалентный» в «двоичный». –
Большая точка. Кажется, вы в основном просите R-код. Это сделало бы это вне темы: см. Справочный центр для консультаций по вопросам, связанным с программным обеспечением. Есть возможность сделать это более статистическим, но вам нужно будет расширить те виды сюжетов, которые вы себе представляете; в настоящее время он полностью открыт, поэтому он слишком широк. –
@NickCox Пожалуйста, см. Мое редактирование, я прилагаю много усилий в этом, поэтому надеюсь, что этого достаточно, чтобы сделать более выполнимый вопрос. –