Выполняю логистическую регрессию с использованием этого page. Мой код выглядит следующим образом.R логистическая область регрессии под кривой
mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv")
mylogit <- glm(admit ~ gre, data = mydata, family = "binomial")
summary(mylogit)
prob=predict(mylogit,type=c("response"))
mydata$prob=prob
После запуска этого кода mydata dataframe имеет две колонки - «признать» и «prob». Должны ли эти два столбца быть достаточными для получения кривой ROC?
Как получить кривую ROC.
Во-вторых, при поиске в mydata, кажется, что модель прогнозирует вероятность admit=1
.
Верно ли это?
Как определить, какое конкретное событие предсказывает модель?
Благодаря
UPDATE: кажется, что ниже трех команд очень полезны. Они обеспечивают отсечку, которая будет иметь максимальную точность, а затем поможет получить кривую ROC.
coords(g, "best")
mydata$prediction=ifelse(prob>=0.3126844,1,0)
confusionMatrix(mydata$prediction,mydata$admit
Не было бы очень просто проверить вашу неуверенность о том, что предсказано с помощью небольшого набора данных? Или просто посмотрите на результаты 'with (mydata, table (admit, gre))'? Логистическая регрессия просто оценивается по множеству таблиц.) –
да ... мы можем так поступать. И я следовал тому же методу, чтобы прийти к выводу, что текущий случай, который он предсказывает, допускает = 1.. но думал, что R будет иметь некоторый ярлык, который подтвердит мое мышление. Любые комментарии по обнаружению порога, который даст максимальную точность от объекта roc? – user2543622
относительно «Любой комментарий об обнаружении порога, который даст максимальную точность от объекта roc?»: Я думаю, что ответ - это координаты (g, «best») ... – user2543622