0

Я использовал логистическую регрессию как классификатор. У меня есть шесть функций, я хочу знать важные функции этого классификатора, которые влияют на результат больше, чем другие функции. Я использовал Information Gain, но, похоже, он не зависит от используемого классификатора. Есть ли какой-либо метод ранжирования функций в зависимости от их важности, основанный на конкретном классификаторе (например, логистическая регрессия)? любая помощь будет высоко оценена.Характеристики ранжирования в логистической регрессии

+0

Вы можете посмотреть конкретный класс методов выбора объектов, а именно методы «Wrapper» и «Embedded», которые учитывают влияние модели вместе с данными. Одним из примеров может быть «Особенность» http://www.sciencedirect.com/science/article/pii/S089812219700059X –

+0

Возможно [этот вопрос] (http://stackoverflow.com/questions/34052115/how-to-find- модель «важности-для-логики-регрессионной регрессии» lq = 1) может помочь? Хотя коэффициенты действительно полезны, если все функции нормализованы (нулевое среднее, все функции имеют одинаковое стандартное отклонение). Я также укажу на [этот вопрос] (http://stackoverflow.com/questions/34529513/how-can-i-get-the-relative-importance-of-features-of-a-logistic-regression-for -a/34723446) в случае, если вы хотите знать важность функции для конкретного примера/предсказания. –

+0

Голосование, чтобы перейти на stats.stackexchange.com - Я думаю, вы получите больше ответов там. –

ответ

0

Вы можете использовать Random Forest Classifier, чтобы дать вам рейтинг ваших возможностей. Затем вы можете выбрать верхние функции x из этого и использовать его для логистической регрессии, хотя Random Forest будет работать отлично.

Заканчивать переменное значение в https://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm

0

Один из способов сделать это является нулевой проверкой гипотез. В принципе, для каждой функции вы проверяете доказательства того, что коэффициент этой функции отличен от нуля. Большинство статистических программ сообщают результаты этих тестов по умолчанию в сводке модели (Scikit-learn и другие ориентированные на машинное обучение инструменты, как правило, не делают этого). С небольшим количеством функций вы можете использовать эту информацию и stepwise regression, чтобы оценить важность функций.

Смежные вопросы