Я пытаюсь работать с некоторыми данными здесь и сравнивать тестовые характеристики glm и lda.Сравнение тестовых характеристик
Данные прилагаются здесь.
Это мой общий план, чтобы попытаться сделать оба из них:
training = read.csv("train.csv")
testing = read.csv("test.csv")
model_glm <- glm(V1 ~.,family=binomial(link='logit'),data=training)
pred_glm <- predict(model_glm, testing)
library(MASS)
model_lda <- lda(V1 ~ ., data=training)
predict_lda <- predict(model_lda, testing)
#Calculating classification error
err_lda <- (pred_lda) - test$V1
err2_lda <- err_lda[err_lda != 0]
classification_error_lda = length(err2_lda)/length(test$V1)
Однако они не работают. Я думал, что существует многокомпонентный семейный класс, но это, похоже, не существует. Кроме того, поскольку мой первый столбец - это цифры, а следующие - значения оттенков серого, я думал, что делаю V1 ~ .
, но я не думаю, что это правильно и для этих случаев. Кто-нибудь есть идеи, если мой синтаксис/установка неверна?
изменить: Я добавил, как я пытаюсь вычислить ошибку классификации для LDA. Однако я не думаю, что мои оригинальные работы вещи, так как это дает:
Error in (pred_lda) - test$V1 : non-numeric argument to binary operator
'pred_glm <- (model_glm, тестирование)' не делает ничего. Вы ищете 'pred_glm <- pred (model_glm, testing)'. – Phil
Ой, извините, это была опечатка с моей стороны - у меня есть прогноз (model_glm, тестирование). Однако это дает мне тот же ответ, что и lm ... и я должен делать мультиклассическую логистическую регрессию здесь. Я не совсем уверен, как это реализовать в этом случае. –