2014-02-04 5 views
3

Я пытаюсь использовать sklearn одномерного выбора функции, чтобы отфильтровать ненужные функции:sklearn выбор одномерной функции

ufs = feature_selection.SelectPercentile(feature_selection.f_classif, percentile = 60) 
X_default_cvtrain = ufs.fit_transform(X_cvtrain, Y_cvtrain) 

Однако, я получаю это предупреждение:

UserWarning: Duplicate scores. Result may depend on feature ordering. 
      There are probably duplicate features, or you used a classification score for a regression task. 
warn("Duplicate scores. Result may depend on feature ordering." 

Что это значит? Что здесь происходит?

Спасибо.

+1

Что вы не понимаете в предупреждающем сообщении? – ogrisel

+0

@ogrisel Извините, я имею в виду, почему это предупреждение появилось. – Munichong

+0

Возможные причины: «Есть, вероятно, повторяющиеся функции, или вы использовали классификационную оценку для задачи регрессии». Мы не можем быть более явными: перейдите и проверьте свои данные. – ogrisel

ответ

5

Это означает, что есть повторяющиеся баллы, поэтому выбранные функции зависят от упорядочения функций. Вероятная причина в том, что у вас есть повторяющиеся функции.

+2

Будучи менее претенциозным после некоторого кофе: это означает, что есть показатели дублирования релевантности (F), поэтому выбранные функции зависят от упорядочения функций в массиве. Вероятная причина в том, что несколько функций идентичны. –

+0

Thx для ур помочь. Но также возможно, что векторы значений двух разных функций оказываются одинаковыми? – Munichong

Смежные вопросы