0

Я построил уравнение регрессии для dataframe поезда (b), у которого есть все Xs (входные переменные) в collist. Моя переменная ответа - Y - SalePrice.Как передать тестовые данные в уравнение регрессии в python?

X = b[collist].values 
y = b[['SalePrice']] 
reg2 = LinearRegression() 
reg2.fit(X, y) 
(reg2.intercept_, reg2.coef_) 

У меня есть набор коэффициентов.

(array([-1003980.93890187]), 
array([[ 1.13921901e+01, 6.72094755e-01, 3.57706059e+02, 
      9.11889135e+01, 1.74211742e+01, 1.49978955e+01, 
      1.01590205e+01, -2.39999419e+00, 2.27570861e+01, 
      .......... 
      ..more terms... 
      1.88596429e+01, 3.57099213e+01, -2.91352714e+01, 
      2.54343753e+01, 1.79479162e+03, 6.95632849e+02, 
      3.97891154e+03, 1.67768978e+03, -2.06711712e+03, 
      -4.70429021e+03]])) 

Как определить, какой коэффициент для какого термина?

Кроме того, как передать тестовый кадр данных в этом уравнении и получить переменную ответа?

для тестовых данных, я получил еще один dataframe, в котором, в столбце SalePrice (response) отсутствует.

спасибо.

ответ

0

Вы должны быть в состоянии zip имена столбцов с коэффициентами ...

[name, coef for name, coef in zip(b.columns, reg2._coef) 

Насколько предсказании на испытательном кадре должно быть что-то вроде

reg2.predict(test_df)

Вы можете также набирают баллы за образец R квадрат

reg2.score(test_X, test_y) 

Просто найдите documentation.

Смежные вопросы