Позвольте мне сказать, во-первых, что я новичок WEKA.Weka - двоичная классификация, дающая поляризованные/предвзятые результаты
Я использую WEKA для проблемы с двоичной классификацией, где определенные метрики используются для получения ответа «да/нет» для экземпляров.
В качестве примера проблемы, вот матрица путаницы я получил для набора с 288 экземплярами, с 190 «да» и 98 «нет» значения не используя BayesNet:
a b <-- classified as
190 0 | a = yes
98 0 | b = no
Это абсолютное разделение в случае с некоторые другие классификаторы, но не со всеми из них. Тем не менее, даже если классификаторы не имеют значений, поляризованных до такой степени, они имеют определенную предвзятость для преобладающего класса. Например, вот результат с RandomForest:
a b <-- classified as
164 34 | a = yes
62 28 | b = no
Я вполне уверен, что у меня что-то очень очевидное.
Так в чем ваш вопрос? Преобладающий класс почти в два раза больше, чем другой, поэтому да, все классификаторы будут (и должны) иметь предвзятость для него. –
Является ли результатом, показывающим полное смещение для преобладающего класса нормального, тогда? Например, с BayesNet, я ВСЕГДА получаю этот полностью односторонний результат с статистическим значением Kappa 0. Независимо от того, какой набор данных или показатели я использую. Так ли это должно работать? Результаты с RandomForest приемлемы, я соглашаюсь, но BayesNet пьет меня. –
Трудно сказать, что происходит без полных данных. Эти функции могут не обеспечить хорошее разделение (по крайней мере, до BayesNet).Я предполагаю, что короткий ответ не использует BayesNet для этой конкретной задачи :) –