Я новичок в интеллектуальном анализе данных, и я пытаюсь обучить дерево решений, но набор данных, который я выбрал, очень предвзято, поэтому результат, который я получаю, также предвзято. Я искал в Интернете, и я наткнулся на сбалансированную точность. Я не доволен результатом.Дерево решений принятия решений с предвзятым набором данных
Будет ли это хорошей идеей, если я сделаю выборку своих данных таким образом, чтобы я пропорционал ее одинаково, как в 1000 случаях YES
и 1000 из NO
?
Вместо того, чтобы передискретизировать набор данных, я бы использовал вес во время обучения. –