2014-08-17 2 views
2

У меня есть ~ 100 элементов данных для одного класса и ~ 6000 для другого класса. Когда я создаю svm, используя данные, он просто возвращает метку категории большинства для каждого нового элемента, который я пытаюсь предсказать. Есть ли способ наказать неправильную классификацию категории меньшинства с помощью sklearn svm, чтобы я мог фактически использовать все мои элементы данных и не должен пробовать 100 элементов из категории большинства для использования в тестировании?Ошибка при печати в одной категории svm sklearn?

+2

вы пробовали 'sample_weight' в [' fit'] (http://scikit-learn.org/stable/modules/generated/sklearn. svm.SVC.html # sklearn.svm.SVC.fit) аргументы? –

ответ

1

SVC имеет следующий параметр, который вы можете использовать

class_weight : {dict, 'auto'}, optional 
    Set the parameter C of class i to class_weight[i]*C for 
    SVC. If not given, all classes are supposed to have 
    weight one. The 'auto' mode uses the values of y to 
    automatically adjust weights inversely proportional to 
    class frequencies. 
Смежные вопросы