2013-03-05 3 views
12

Извините, я новичок в WEKA и просто изучаю.Как читать матрицу смешения классификатора в WEKA

В моем дереве решений (J48) Выходной классификатор, существует путаница Матрица:

a b <----- classified as 
130 8  a = functional 
15 150 b = non-functional 
  • Как читать эту матрицу? В чем разница между & b?
  • Кроме того, может ли кто-нибудь объяснить мне, какие значения домена?

ответ

20

Вы прочитали wikipedia page on confusion matrices? Текст вокруг матрицы немного отличается в своем примере (ярлыки строк слева, а не справа), но вы читаете его точно так же.

Строка указывает истинный класс, столбец указывает выход классификатора. Затем каждая запись дает количество экземпляров <row>, которые были классифицированы как <column>. В вашем примере 15 Bs были (ошибочно) классифицирована как As, Bs, 150 были правильно классифицированы как Bs и т.д.

В результате все правильные классификации на верхнем левом, чтобы нижний правый диагонали. Все, что диагональ, является некорректной классификацией.

+0

Я исправлю, что CM в WEKA: Строка 1: 'TP | FP' Строка 2: 'FN | TN' – 2014-01-30 10:59:57

+0

@ user75782131: Я бы так не сказал. Ваше утверждение о True Positives и т. Д. Относится только к задачам с 2 классами, где есть четкие положительные и отрицательные классы. Многие проблемы классификации не такие, но у них все еще есть путаные матрицы. – Junuxx

+0

И для проблемы с 2 классами, если положительный класс имеет индекс 0, это означает, что первая строка - это TP, FN, а вторая строка - FP, TN. – silmeth

7

Я бы сказал так:

Путаница матрица Weka отчетов о том, как хорошо это J48 модель с точки зрения того, что он получает право, и то, что он получает неправильно.

В ваших данных целевая переменная была либо «функциональной», либо «нефункциональной»; правая часть матрицы говорит вам, что столбец «a» является функциональным, а «b» нефункциональным.

Столбцов сказать вам, как ваша модель классифицировать ваши образцы - это то, что модель предсказала:

  • Первый столбец содержит все образцы, которые ваша модель посчитает «а» - 145 из них, общей
  • Второй столбец содержит все образцы, которые ваша модель посчитает «б» - 158 из них

строки, с другой стороны, представляют собой реальность:

  • Первая строка содержит все образцы, которые действительно являются «а» - 138 из них, общей
  • Вторая строка содержит все образцы, которые действительно являются «б» - 165 из них

Зная столбцы и строки, вы можете копаться в деталях:

  • в левом верхнем углу, 130, вещи, ваша модель думает, являются «», которые на самом деле являются «а» < - это были правильно
  • Внизу слева, 15 , являются NGS ваша модель думает, являются «» но действительно «б» < - один вид ошибки
  • Вверху справа, 8, вещи, ваша модель посчитает «б», но которые действительно являются «» < - другое вид ошибки
  • Внизу справа, 150 вещи ваша модель посчитает «б», которые действительно «б»

Так верхний левый и нижний правый матрицы показывают вещи, ваша модель получает право ,

Нижние левые и верхние правые матрицы показывают, где ваша модель сбита с толку.

Смежные вопросы