5

enter image description hereЧто означает значение «листа» в следующей диаграмме дерева модели xgboost?

Я предполагаю, что это условная вероятность, учитывая, что условие выше (ветка дерева) существует. Однако я не понимаю.

Если вы хотите узнать больше о данных используются или как мы получаем эту диаграмму, то перейдите по ссылке: http://machinelearningmastery.com/visualize-gradient-boosting-decision-trees-xgboost-python/

+0

Я вижу некоторые отрицательные значения в каком-то листе? – dksahuji

ответ

0

Атрибуту leaf является прогнозируемым значением. Другими словами, если оценка древовидной модели заканчивается на этом конечном узле (ака-лист), то это значение, которое возвращается.

В псевдокоде (самая левая ветвь дерева модели):

if(f1 < 127.5){ 
    if(f7 < 28.5){ 
    if(f5 < 45.4){ 
     return 0.167528f; 
    } else { 
     return 0.05f; 
    } 
    } 
} 
1

Вы правильно. Эти значения вероятности, связанные с листовыми узлами, представляют собой условную вероятность достижения узлов листа с учетом определенной ветви дерева. Ветви деревьев могут быть представлены в виде набора правил. Например, @ user1808924 упоминается в его answer; одно правило, представляющее самую левую ветвь вашей древовидной модели.

Итак, вкратце: дерево можно линеаризовать в правилах принятия решений, где результатом является содержимое листового узла, а условия вдоль пути образуют конъюнкцию в условии if. В целом, правила имеют вид:

if condition1 and condition2 and condition3 then outcome. 

Правила принятия решений могут быть получены путем построения ассоциативных правил с целевой переменной справа. Они также могут обозначать отношения temporal или causal.

Смежные вопросы