2016-02-09 2 views
0

Мне было любопытно узнать, помогает ли уменьшение количества классов в контролируемой классификации (в частности, логистическая регрессия) для классификации нескольких классов в повышении точности. Например, если у меня есть 50 классов для 10000 выборок, и я уменьшаю количество классов до 30, объединяя некоторые классы вместе. Будет ли это значительно повысить точность моей классификации?Устраняет ли уменьшение классов в методе классификации точность?

+1

Классификация вещей - это тема _vast_. Существует так много разных методов классификации, что на ваш вопрос нельзя ответить должным образом. – Carsten

+0

@ Карстен Я прошу поднадзорную классификационную модель (многоклассовую классификацию) с моделью логистической регрессии. Я действительно пытался уменьшить темы, но, как и от 50 до 45 до 41, и я вижу только разницу десятичной точки в увеличении. Так этот вопрос поразил меня. – minks

+0

Возможно, поместите эту информацию в свой вопрос? :) – rbaleksandar

ответ

4

Это, безусловно, улучшит вашу производительность, если классы, которые вы совмещаете, схожи и имеют значительное количество образцов, которые пропускаются между ними, потому что это уменьшит ошибки.

Например:

  • Представьте, что вы классификации образцов 4 различных категорий (кошки, собаки, стулья, столы)
  • Если сгруппировать эти классы вместе и выполнять животное против не-животного КЛАССИФИКАЦИЯ , все ошибки классификации, которые произошли, когда кошка была классифицирована как собака (и наоборот), больше не произойдет, и ваша общая точность улучшится.

Если классы, которые вы группируете, не похожи, это, скорее всего, не улучшит вашу точность, поскольку вы не уменьшите количество ошибок. Представьте себе, что ваш классификатор настолько хорош, что вы не ошибаетесь ни в кошке, как в собаке, ни в обратном, вы не будете уменьшать ошибки при объединении этих классов, потому что их нет.

2

Эффекты уменьшения количества классов зависят как от алгоритма, так и от набора данных. В общем, нет никакой гарантии, что уменьшение количества классов повысит точность классификации. Во многих случаях верно обратное - , увеличивая число, количество классов может повысить точность классификации.

Например, для многих наборов данных вы можете сделать каждое наблюдение соответствующим уникальному классу и получить 100% -ную точность классификации. Это очевидный пример переобучения, но он доходит до того, что увеличение (в отличие от уменьшения) количества классов иногда может улучшить точность классификации.

Смежные вопросы