2014-12-19 6 views
0

В настоящее время я работаю над реализацией алгоритма ID3. Я проходил классический пример игры в теннис, но я не могу понять, почему атрибут TEMPERATURE не учитывается в финальном дереве. Может ли кто-нибудь объяснить, почему это так?ID3 Decision Tree Clarification

DATA SET enter image description here

Окончательное решение ДЕРЕВО enter image description here

ответ

0

В ID3 algorithm заканчивается в одном из трех сценариев:

  • каждый элемент в подгруппе принадлежит к тому же классу (+ или -), то узел превращается в лист и помеченный классом примеров
  • больше нет атрибутов, которые должны быть выбраны, но примеры по-прежнему не относятся к одному и тому же классу (некоторые из них являются +, а некоторые - -), затем узел превращается в лист и помечен с наиболее распространенным классом примеров в подмножестве
  • нет примеров в подмножестве, это происходит, когда не было найдено ни одного примера в родительском наборе для конкретного значения выбранного атрибута, например, если бы не было пример с возрастом> 100. Затем создается лист и помечен наиболее распространенным классом примеров в родительском наборе.

Возьмите, например, Outlook: солнечный и влажный: высокий/нормальный. Есть три «высоких» ряда, и все они говорят «Нет» теннису. Поэтому возникает первый сценарий, и листья могут быть созданы. Существует больше информации, но она не нужна для принятия решения.