2013-05-16 2 views
0

Деревья принятия решений обычно должны определять для каждого наблюдения (экземпляра) класс результатов (например, солнечный свет, дождь, ...).Любой метод определения класса экземпляров?

Мне интересно, есть ли алгоритм интеллектуального анализа данных, который может группировать экземпляры на основе атрибута, определяющего класс.

Ниже приведен пример:

day, outlook, temp, humidity, windy, play 
1, sunny, 85, 85, false, no 
2, sunny, 80, 90, true, no 
3, overcast, 80, 90, true, no 
3, rainy, 80, 90, true, no 

В этом случае я мог бы, например, использовать игру или прогноз как результат класса.

Мой вопрос в том, есть ли какой-либо алгоритм или метод, который бы сказал, что, например, outlook - это атрибут, который я мог бы использовать в качестве исходного класса.

+0

Я не уверен, правильно ли получил ваш вопрос. Что вы хотите сделать, это определить атрибуты, которые предполагают, что экземпляр принадлежит определенному классу? Это очень упрощенный и наивный пример, но я надеюсь, что он может помочь, учитывая атрибуты: «влажный пол», «люди с зонтиками»; они, вероятно, очень связаны с классом «дождь». С уважением, – miguelmalvarez

+0

Я перефразировал свой вопрос и добавил пример. –

+0

вы можете попробовать Weka, я думаю, у него есть инструмент, чтобы сделать ранжирование функций .. он расскажет вам о самых отличительных особенностях для всех экземпляров .. это то, что вы ищете? –

ответ

0

Очевидно, что непрерывные атрибуты не будут работать.

Но кроме этого, любой дискретный атрибут может работать.

Вопрос заключается в том, что вы хотите сделать, как бы компьютерная программа знать?

Вам нужно будет рассказать об этом, который является вашим выходом, и какие ваши входы.

Некоторые программы, конечно же, будут применять эвристику, то есть если атрибут называется «классом» или использует специальный тип «class», он будет автоматически выбран в качестве вывода, а остатки - как входы.

Смежные вопросы