SGD модель «overconfidence»

Я работаю над проблемой двоичной классификации, используя Apache Mahout. Используемый мной алгоритм - это OnlineLogisticRegression, и модель, которую я в настоящее время имеет, имеет тенденцию производить прогнозы, которые либо 1, либо 0 без каких-либо средних значений.SGD модель «overconfidence»

Просьба предложить способ настройки или настройки алгоритма, чтобы он производил более промежуточные значения в прогнозах.

Заранее благодарен!

источник

2013-02-11 Alexander Oleynikov

Какова частота ошибок при испытаниях классификатора? Если он близок к нулю, то уверенность - это функция, а не ошибка.

Если коэффициент ошибок при тестировании является высоким (или, по крайней мере, не низким), то классификатор может переоборудовать набор тренировок: измерять разницу между ошибкой обучения и ошибкой теста. В этом случае усиление регуляризации, как предлагалось, может помочь.

Если ваш классификатор не перерабатывает, может возникнуть проблема с калибровкой вероятности. Модели логистической регрессии (например, с использованием функции логит-ссылки) должны давать достаточно хорошие калибровочные вероятности (если проблема примерно линейно отделима и метка не слишком шумная). Вы можете проверить калибровку вероятностей на график, как описано в this paper. Если это действительно проблема калибровки, то внедрение специальной калибровки, основанной на масштабировании Platt или изотонической регрессии, может помочь исправить проблему.

источник

2013-02-12 11:08:49 ogrisel

Из-за чтения документов Mahout AbstractOnlineLogisticRegression, похоже, вы можете управлять параметром регуляризации лямбда. Увеличение лямбды должно означать, что ваши веса ближе к 0, и, следовательно, ваши прогнозы более хеджируются.

источник

2013-02-12 07:14:30

Да, я играл с лямбдой. Со значениями, достаточными для создания таких значений, как, например, я хочу, чтобы точность модели сильно ухудшалась. –

У меня есть идея расширить подход регуляризации, добавив штраф к модели не только, если она имеет слишком высокие значения в весах, но также и если ее значения предсказания слишком велики (перед применением сигмовидной функции). Что вы можете сказать об этом? –

SGD модель «overconfidence»

ответ

Смежные вопросы