У меня очень несбалансированные данные, и цель - классификация. Во-первых, я хочу проверить недочеты в классе мажоритов. Класс 1 с 600, класс2 90, класс3 60 и класс4 96 выборочных данных !!!Работа с несбалансированными данными с использованием веса
Используя вес: В 2 раза кросс проверки и модели RandomForest:
Почему используя вес, результат не лучше? Мой код: cfr = RandomForestClassifier(n_estimators=100,n_jobs=5,class_weight={1:1,2:30,3:30,4:30})
Что-то не так в моем коде? Не могли бы вы направить меня?
Я попытался использовать вес. Я использую случайный лес sklearn, я не знаю, как мне найти эффективные числа для весов. Я использовал cfr = RandomForestClassifier (n_estimators = 100, n_jobs = 5, class_weight = {1: 1,2: 3,3: 3,4: 3}), но это не повлияло. Я использовал более высокие цифры для групп 2,3 и 4, как 10, 20 или даже 100. Результаты были хуже. – Talia
извините, результат немного лучше или тот же – Talia