У меня вопрос о перекрестной проверке: я использую классификатор Naive Bayes для классификации сообщений блога автором. Когда я проверяю свой набор данных без к-кратной проверки перекрестных ссылок, я получаю оценку точности 0,6, но когда я выполняю кросс-проверку перекрестных ссылок, каждая справка дает гораздо более высокую точность (более 0,8).Точность увеличивается с использованием кросс-валидации и уменьшается без
Например:
(расщепление вручную): Проверка Набор Размер: 1452, обучающего множества Размер: 13063, Точность: 0.6033057851239669
, а затем
(с к -fold): Fold 0 -> Training Set Size: 13063, Validation Set Размер: 1452 Точность: 0.8039702233250621 (все форы выше 0.8)
и т.д.
Почему это происходит?
, пожалуйста, не перекрестно отправляйте свой вопрос на несколько сайтов SE ... http://stats.stackexchange.com/questions/138449/accuracy-increases-using-cross-validation-and-decreases-without – cel