Я пытаюсь выполнить выбор функции, оценивая выходы коэффициента регрессии и выбираю функции с наивысшими коэффициентами величины. Проблема в том, что я не знаю, как получить соответствующие функции, так как возвращаются только коэффициенты из атрибута coef._. В документации указано:Scikit-Learn Линейная регрессия, как получить соответствующие функции коэффициента?
Оценочные коэффициенты для задачи линейной регрессии. Если во время подгонки (y 2D) передано несколько целей , это 2D-массив формы (n_targets, n_features), а если передана только одна цель, это 1-й массив длины n_features.
Я перехожу в свой регрессионный.fit (A, B), где A - это 2-мерный массив с значением tfidf для каждой функции в документе. Пример формата:
"feature1" "feature2"
"Doc1" .44 .22
"Doc2" .11 .6
"Doc3" .22 .2
В мои целевые значения для данных, которые только номера 1-100, связанные с каждым документом:
Использование regression.coef_, я получаю список коэффициентов, но не их соответствующие функции! Как я могу получить функции? Я предполагаю, что мне нужно модифицировать структуру моих целей B, но я не знаю, как это сделать.
Это верно, если функция regression.coef_ возвращает значения коэффициентов в том же порядке. Благодарю. – jeffrey
ExtraTreesClassifier на самом деле очень интересен, но кажется, что нет способа получить фактические функции, которые он выбрал после того, как модель подойдет? – jeffrey
@jeffrey Да, но я всегда выбираю функцию 'clf.feature_importances_' для получения рейтинга важности функций. Ну интуитивно это так же, как коэффициенты линейной модели, не так ли? – Jake0x32