2016-06-07 4 views
2

Я хотел бы отобразить матрицу путаницы после поезда() библиотеки каретки, но у меня есть некоторые сомнения. «Train()» должен быть в наборе поездов? (Я не уверен из-за параметра «control»). «Предсказывать()» на тестовом наборе? Это кажется странным, чтобы предсказать на весь набор данных ...R каретка/матрица замешательства

# df_corpus = Document Term Matrix + 1 column of Cos.code(class which are 203.2.2, 204.3.2 ...) 
dataset <- df_corpus 
control <- trainControl(method = "repeatedcv", number = 10, repeats = 3) 
seed <- 7 

metric <- "Accuracy" 
preProcess=c("center", "scale") 

# Linear Discriminant Analysis 
set.seed(seed) 
fit.lda <- train(Cos.code~., data=dataset, method="lda", metric=metric,preProc=c("center", "scale"), trControl=control) 
ldaClasses <- predict(fit.lda) 
cm <- confusionMatrix(data = ldaClasses, dataset$Cos.code) 
F1_score(cm$table, "lda") 

Спасибо за вашу помощь

ответ

2

Вы можете получить матрицу путаницы, как это:

confusionMatrix(dataset$Cos.code,predict(fit.lda,dataset$Cos.code)) 

Вы можете рассчитать путаницу матрицу таким же образом для вашего набора тестов, просто переключите наборы данных.

Но я считаю, что ваша модель должна содержать уже информацию, которую вы хотите Изучите информацию, данную при печати этих двух объектов.

fit.lda 

fit.lda$finalModel