2013-09-25 7 views
0

У меня есть некоторые помеченные данные, которые классифицируют наборы данных как положительные или отрицательные. Теперь у меня есть алгоритм, который делает то же самое автоматически, и я хочу сравнить результаты.Какие классификаторы оценки? Точность и отзыв?

Говорят, что я использовал точность и отзыв, но я не уверен, подходят ли они, потому что истинные негативы даже не появляются в формулах. Я бы предпочел использовать общий «коэффициент прогнозирования» для обоих, положительных и отрицательных.

Каким образом можно было бы оценить алгоритм? Благодаря!!

+0

Не могли бы вы предоставить свой код? – Beppe

+0

Результаты выглядят так:

 data + user + algorithm ----------|------|---------- some text | pos | pos other txt | neg | pos whatever | neg | neg littlepny | pos | neg stackover | neg | pos

+0

sry для формата ... я новый здесь ... результаты выглядят так: {[some text, pos, pos]; [другой txt, neg, pos]; [что угодно, neg, neg]; [littlepny, pos, neg]} ... так что это похоже на некоторые данные, затем ручную аннотацию, затем вывод программы. ... и я просто не уверен, что я должен использовать точность/отзыв, чтобы показать, насколько это хорошо работает или какие-то другие «числа» ... ;-) –

ответ

0

Там нет общего «лучшего» метода оценки, все зависит от того, что ваша цели, как каждый метод захватывает различные феномены:

  • Точности является простой мерой, хорошо подходит для классификации несколько этикеток и а также сбалансированный данные
  • F1-оценка захватывает точность/повторный вызов компромисс
  • МСС является хорошей мерой, которая хорошо подходит для набора данных с большим dissproportion в классе размеров
Смежные вопросы