У меня есть набор данных из двух классов, которые я использовал для классификации его классификатора Наивного Байеса. Во-первых: обучение и тестирование классификаторов в те же данные я получил:Испытание и поезд по тем же данным или по другим данным
Accuracy: 71.1262
False negative rate: FN/FN+TP = FN/P= 284/295 = 0.840
False positive rate: FP/FP+TN = FP/N = 93/886 = 0.104
Sensitivity: Recall:True positive rate: TP/TP+FN = TP/P = 0.1593
Specificity: True negative rate: TN/TN+FP = TN/N = 0.8950
Precision : Positive Predictive Value: TP/TP+FP = 0.3357
Negative Predictive Value: TN/TN+FP = 0.7618
Во-вторых: я тренировалась классификатор в образце тестируют в другом образце я получил:
Accuracy: 0.7704
False negative rate: FN/FN+TP=FN/P =147/222 = 0.662
False positive rate: FP/FP+TN= FP/N = 73/736=0.099
Sensitivity: Recall:True positive rate: TP/TP+FN=TP/P=75/222= 0.3378
Specificity: True negative rate:TN/FP+FP=TN/N= 663/736 = 0.9008
Precision : Positive Predictive Value:TP/TP+FP= 0.5068
На самом деле, когда я попытался с Решению дерева и Нейронная сеть Я получил почти аналогичный результат Является ли этот нормальный результат? какова именно проблема в этих данных?
Ваши классы явно несбалансированы , что дает вам большую разницу между ставками FN и FP. Можете ли вы наложить некоторые абсолютные значения на эти метки? Как сколько положительных/отрицательных примеров у вас есть? –
В первом эксперименте: размер поезд данных 1181. Размер отрицательного класса 886. Размер положительного класса 295. данных Размер тест 1181. Размер отрицательного класса 886. Размер положительного класса 295. –
Во втором эксперименте: поезд данных Размер 1181. Размер отрицательного класса 886. Размер положительного класса 295. тест данных Размер 958. Размер отрицательного класса 736. Размер положительного класса 222. –