2015-07-22 3 views
2

Я делаю MultiClass классификацию и применяющие логистическую регрессию на немлогистическая регрессия Scikit-Learn Получения коэффициентов классификации

Когда я установлен данные по телефону

logistic.fit(InputDATA,OutputDATA) 

оценщик «логистический» приспосабливает данные.

Теперь, когда я называю logistic.coef_ он печатает 2D массив с 4-мя рядами (I HAD четыре класса) и п столбцов (по одному для каждой функции)

ЭТО ТО, ЧТО Я УВИДЕЛ НА SCIKIT УЗНАТЬ САЙТ:

coef_: array, shape (n_features) или (n_targets, n_features) Оценочные коэффициенты для задачи линейной регрессии. Если во время подгонки (y 2D) передано несколько целей , это 2D-массив формы (n_targets, n_features), а если передана только одна цель, это 1D массив длины n_features.

Теперь мой запрос: Почему разные коэффициенты существуют для разных классов, так как мне нужна только одна гипотеза, которая предсказывала бы выход.

ответ

1

Поскольку у вас есть многоклассовый футляр (> 2 случая), применяется стратегия one-vs-rest. sklearn создает 4 классификатора, а не только 1. Следовательно, у вас есть 4 гипотезы и 4 * коэффициенты.

Примечание: я не имею понятия о логистическом регрессионном классификаторе, но так работает SVM-файл sklearn.

+0

Спасибо большое. Я получил его сейчас. Теперь, используя четыре классификатора, один с максимальной вероятностью формирует выходной класс. –

+0

Итак, делает ли logistic.predict этот метод для выбора соответствующего классификатора? –

+1

На этапе обучения генерируются 4 классификатора. Один разделить A от BCD, один отделить B от ACD и так далее. Новый образец (т. Е. Pred()) подается во все четыре классификатора. Побеждает классификатор с наивысшей защитой. Например, ваш новый класс C, тогда вероятность классификатора C и ABD выше, чем другие. C - возвращаемое значение предсказывает(). – fgoettel

Смежные вопросы