2013-11-26 6 views
2

Я пытаюсь вычислить метрику с данными panda dataframes. В частности, я получаю результаты объектаPandas dataframe вычисления

prediction = results.predict(start=1,end=len(test),exog=test) 

Фактические значения в dataframe дается

test['actual']. 

Мне нужно вычислить две вещи:

  1. Как я могу вычислить сумма квадратов ошибок? Таким образом, в основном, я бы делал элемент путем вычитания элементов, а затем суммировал их квадраты.

  2. Как я могу вычислить сумму квадратов предсказанного минус среднее значений? Поэтому было бы

    (x1-mean_actual)^2 + (x2-mean_actual)^2...+(xn-mean_actual)^2 
    

ответ

3

Сначала один будет

((prediction - test['actual']) ** 2).sum() 

Второй один будет:

((prediction - test['actual'].mean()) ** 2).sum() 
+0

Я получаю значение нан для первого. Что это значит? – user1802143

+0

у вас есть NaN в ваших данных? –

+0

Я думаю, что это должно быть .sum() –

Смежные вопросы