Я использовал логистическую регрессию как классификатор. У меня есть шесть функций, я хочу знать важные функции этого классификатора, которые влияют на результат больше, чем другие функции. Я использовал Information Gain, но, похоже, он не зависит от используемого классификатора. Есть ли какой-либо метод ранжирования функций в зависимости от их важности, основанный на конкретном классификаторе (например, логистическая регрессия)? любая помощь будет высоко оценена.Характеристики ранжирования в логистической регрессии
ответ
Вы можете использовать Random Forest Classifier, чтобы дать вам рейтинг ваших возможностей. Затем вы можете выбрать верхние функции x из этого и использовать его для логистической регрессии, хотя Random Forest будет работать отлично.
Заканчивать переменное значение в https://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm
Один из способов сделать это является нулевой проверкой гипотез. В принципе, для каждой функции вы проверяете доказательства того, что коэффициент этой функции отличен от нуля. Большинство статистических программ сообщают результаты этих тестов по умолчанию в сводке модели (Scikit-learn и другие ориентированные на машинное обучение инструменты, как правило, не делают этого). С небольшим количеством функций вы можете использовать эту информацию и stepwise regression, чтобы оценить важность функций.
- 1. Heatmap для логистической регрессии
- 2. Векторизация логистической регрессии стоимость
- 3. логистической регрессии Macro
- 4. использования SciKitLearn логистической регрессии
- 5. логистической регрессии - функция потерь
- 6. Модель онлайн-логистической регрессии
- 7. Реализация логистической регрессии в MATLAB
- 8. Модели логистической регрессии в ggplot2
- 9. Диапазон возможностей в логистической регрессии
- 10. Ошибка логистической регрессии в r
- 11. Ошибка в многолинейной логистической регрессии
- 12. неправильный участок в логистической регрессии
- 13. Уменьшение переменных логистической регрессии - MATLAB
- 14. Понимание вероятностной интерпретации логистической регрессии
- 15. логистической регрессии Использования Зелиги [R]
- 16. Интерпретация и построение логистической регрессии
- 17. Понимание значения коэффициентов логистической регрессии
- 18. Как рассчитать веса логистической регрессии?
- 19. Theano логистической регрессии несоответствие размера
- 20. R ошибки логистической регрессии округления?
- 21. PCA снижает производительность логистической регрессии?
- 22. geom_abline для логистической регрессии (ggplot2)
- 23. Newton Raphson для логистической регрессии
- 24. Проверка переходов для логистической регрессии
- 25. Понимание этой реализации логистической регрессии
- 26. график границы решения логистической регрессии
- 27. statsmodels проблемы логистической регрессии типа
- 28. Как интерпретировать вывод логистической регрессии?
- 29. Как рассчитать кривую логистической регрессии?
- 30. OutOfMemoryError во время логистической регрессии в SparkR
Вы можете посмотреть конкретный класс методов выбора объектов, а именно методы «Wrapper» и «Embedded», которые учитывают влияние модели вместе с данными. Одним из примеров может быть «Особенность» http://www.sciencedirect.com/science/article/pii/S089812219700059X –
Возможно [этот вопрос] (http://stackoverflow.com/questions/34052115/how-to-find- модель «важности-для-логики-регрессионной регрессии» lq = 1) может помочь? Хотя коэффициенты действительно полезны, если все функции нормализованы (нулевое среднее, все функции имеют одинаковое стандартное отклонение). Я также укажу на [этот вопрос] (http://stackoverflow.com/questions/34529513/how-can-i-get-the-relative-importance-of-features-of-a-logistic-regression-for -a/34723446) в случае, если вы хотите знать важность функции для конкретного примера/предсказания. –
Голосование, чтобы перейти на stats.stackexchange.com - Я думаю, вы получите больше ответов там. –