У меня есть несбалансированные классы записей и данных, как следующее:Data Mining и несимметричные Классы
X Y Z Class
1 4 Good A
3 5 Very Good A
7 6 Good A
8 7 Excellent A
4 8 Pass A
3 7 Good A
34 6 Good A
1 5 Very Good A
4 3 Excellent B
4 4 Excellent B
Я хочу, чтобы предсказать класс:
- что лучшие методы интеллектуального анализа данных?
- Я использовал дерево решений, но, к сожалению, я столкнулся с проблемой несбалансированной записи, и я был не в состоянии классифицировать данные
Деревья принятия решений могут обрабатывать несбалансированные данные. Фактически, с каждым расколом они пытаются ** максимизировать несбалансированность ** (ака: чистота). –