2015-05-17 3 views
1

Я выполняю OLS на двух наборах данных Y и X. Я использую statsmodel.api.OLS. Однако я нашел несколько разных результатов, добавляю ли я константу в X до или нет. Вот код:Нужно ли добавлять константу при использовании sm.OLS?

import statsmodels.api as sm 
import numpy as np 

mess = "SELECT .... FROM... WHERE ...." 
data = np.array(db.extractData(mess)) 
Y = data[,:0] 
X = data[,:1] 
#Option1 
res = sm.OLS(Y,X).fit().rsquared ---> will return 0.76 
#Option2 
X = sm.add_constant(X) 
res = sm.OLS(Y,X).fit().rsquared ---> will return 0.06 

Учитывая огромную разницу ли не добавлять I константа, я предполагаю, что я делаю что-то неправильно. Большое спасибо за ваше время.

ответ

Смежные вопросы