2016-10-17 5 views
1

Это выход WEKA, который я смог сгенерировать. К несчастью, я не знаю, как вычислить матрицу путаницы. Может кто-нибудь помочь мне рассчитать это?Как вычислить матрицу Confusion?

=== Classifier model (full training set) === 

J48 pruned tree 

----------------- 

plas <= 127: negative (485.0/94.0) 
plas > 127 
| mass <= 29.9 
| | plas <= 145: negative (41.0/6.0) 
| | plas > 145 
| | | age <= 25: negative (4.0) 
| | | age > 25 
| | | | age <= 61: positive (27.0/9.0) 
| | | | age > 61: negative (4.0) 
| mass > 29.9 
| | plas <= 157 
| | | age <= 30: negative (50.0/23.0) 
| | | age > 30: positive (65.0/18.0) 
| | plas > 157: positive (92.0/12.0) 

Number of Leaves : 8 

Size of the tree : 15 

a. Используйте вывод WEKA для построения матрицы путаницы. (Подсказка: посмотрите на каждый листовой узел, чтобы определить, сколько экземпляров попадает в каждый из четырех квадрантов, и суммируйте результаты всех листовых узлов для получения окончательных отсчетов) enter image description here

TP =?

FP =?

FN =?

TN =?

b. В медицинской диагностике обычно используются три метрики: чувствительность, специфичность и точность диагностики. Чувствительность определяется как TP/(TP + FN); Специфичность определяется как TN/(FP + TN); Точность диагностики определяется как среднее значение чувствительности и специфичности. Вычислите точность диагностики, основанную на приведенной выше матрице путаницы.

Если кто-то может помочь мне в этом, я был бы очень признателен. Спасибо!

+0

На каком языке, хотите ли вы иметь код? – hpfs

+0

Разве Weka обычно не дает вам матрицу путаницы автоматически? Вы также можете задать этот вопрос скорее на http://stats.stackoverflow.com, который лучше подходит, если ваши вопросы сосредоточены на машинах, а не на конкретной реализации. – Sentry

ответ

0

Здесь, чтобы заполнить требуемую таблицу, вы должны понимать дерево и фигуры на каждом своем листе. Корневой узел дерева - это «плас». У него двое детей. Все случаи ввода, где «plas» меньше или равно 127, приходится на первого ребенка, тогда как все случаи, когда «plas» больше 127, падает на секунду. Отрицательный в листе первого ребенка указывает, что случаи, которые выпадают на первого ребенка, все отрицательны. Рисунок 485 в круглых скобках обозначает количество входных событий, которые имеют «plas», меньшие или равные 127 & 94 означает, что из этих 485 случаев 94 классифицируются как отрицательные. Как и в случае остальной части дерева. Так,

  • TP = 145
  • FP = 39
  • TN = 461
  • FN = 123

Надеется, что это помогает. Комментарий, если что-то кажется сомнительным.

1

В панели «Классификация» нажмите «Дополнительные параметры», нажмите «Выходная матрица замешивания», нажмите «ОК».

Я добавил скриншот соответствующих экранов и диалоговых окон графического интерфейса пользователя. В sccreenshot кнопка «Дополнительные параметры ...» (1) выделена серым цветом, потому что я уже щелкнул ее.

enter image description here

Смежные вопросы