2014-11-26 1 views
2

У меня возникли проблемы с интерпретацией результатов запуска линейного регрессионного классификатора на обучающем наборе cpu.with.vendor.arff. Как обрабатывать первые 11 значений в уравнении, где указано номинальное значение?Линейная регрессия с номинальным атрибутом weka

=== Run information === 

Scheme:weka.classifiers.functions.LinearRegression -S 0 -R 1.0E-8 

Linear Regression Model 

class = 

-152.7641 * vendor=microdata,prime,formation,harris,dec,wang,perkin-elmer,nixdorf,bti,sratus,dg,burroughs,cambex,magnuson,honeywell,ipl,ibm,cdc,ncr,basf,gould,siemens,nas,adviser,sperry,amdahl + 
141.8644 * vendor=prime,formation,harris,dec,wang,perkin-elmer,nixdorf,bti,sratus,dg,burroughs,cambex,magnuson,honeywell,ipl,ibm,cdc,ncr,basf,gould,siemens,nas,adviser,sperry,amdahl + 
-38.2268 * vendor=burroughs,cambex,magnuson,honeywell,ipl,ibm,cdc,ncr,basf,gould,siemens,nas,adviser,sperry,amdahl + 
39.4748 * vendor=cambex,magnuson,honeywell,ipl,ibm,cdc,ncr,basf,gould,siemens,nas,adviser,sperry,amdahl + 
-39.5986 * vendor=honeywell,ipl,ibm,cdc,ncr,basf,gould,siemens,nas,adviser,sperry,amdahl + 
21.412 * vendor=ipl,ibm,cdc,ncr,basf,gould,siemens,nas,adviser,sperry,amdahl + 
-41.2397 * vendor=gould,siemens,nas,adviser,sperry,amdahl + 
32.0545 * vendor=siemens,nas,adviser,sperry,amdahl + 
-113.6927 * vendor=adviser,sperry,amdahl + 
176.5205 * vendor=sperry,amdahl + 
-51.2583 * vendor=amdahl + 
0.0616 * MYCT + 
0.0171 * MMIN + 
0.0054 * MMAX + 
0.6654 * CACH + 
-1.4159 * CHMIN + 
1.5538 * CHMAX + 
-41.4854 

ответ

1

Если поставщик равен любому из номинальных значений линии, то значение равно единице, в противном случае это значение равно нулю.

Например, в строке 1:

-152.7641 * vendor=microdata,prime,formation,harris,dec,wang,perkin-elmer,nixdorf,bti,sratus,dg,burroughs,cambex,magnuson,honeywell,ipl,ibm,cdc,ncr,basf,gould,siemens,nas,adviser,sperry,amdahl 

Значения будет вычитают 152.7641, если и только если поставщик равно одному из [микроданный, простой, образования, Харрис, декабрь, Ван, perkinlmer , nixdorf, bti, sratus, dg, burroughs, cambex, magnuson, honeywell, ipl, ibm, cdc, ncr, basf, gould, siemens, nas, adviser, sperry, amdahl].

Значение может быть дополнительно скорректировано на основе других 10 тестов по атрибуту, что приводит к различным смещениям для разных номинальных значений.

Надеюсь, что это поможет!

Смежные вопросы