2015-07-16 3 views
2

Я использую функцию scipy.stats.linregress сделать простую линейную регрессию на некоторых 2D данных, например:Определения стандартной ошибки в scipy.stats.linregress

from scipy import stats 
x = [5.05, 6.75, 3.21, 2.66] 
y = [1.65, 26.5, -5.93, 7.96] 
gradient, intercept, r_value, p_value, std_err = stats.linregress(x,y) 

Документация о функции говорится, что std_err является :

Стандартная ошибка оценки

Я не уверен, что это значит. В этом old answer говорится, что он представляет стандартную ошибку градиентной линии, но это «не всегда является поведением этой библиотеки».

Могу ли я получить точное определение того, что именно представляет этот параметр?

+1

Это стандартная мера в статистике. См. Https://en.wikipedia.org/wiki/Ordinary_least_squares#Finite_sample_properties для описания того, как его вычислить. Говоря простыми словами, это говорит о том, насколько хорошо подходит градиент (более высокие значения означают менее точный) для ваших данных. –

+0

@JamesPringle, не могли бы вы опубликовать свой комментарий в качестве ответа, чтобы я мог его принять? – Gabriel

ответ

0

Это стандартная мера в статистике. См. wikipedia для описания того, как его вычислить. К сожалению, stackoverflow, похоже, не поддерживает LaTeX, поэтому нет смысла записывать и объяснять уравнения здесь.

По существу, std_err должен давать значение для каждого коэффициента, представленного в градиенте. Простыми словами std_err говорит вам, насколько хорош градиент (более высокие значения означают менее точный) для ваших данных.

Другие полезные ответы на сайтах stats.stackexchange: here и here.

1

По состоянию на декабрь 2016 года, я думаю, что он все еще показывает стандартную ошибку наклона линии регрессии OLS. Я вычислил регрессию некоторых наборов данных, используя orthogonal distance regression как часть пакета scipy, а the output'ssd_beta[1] (представитель стандартной ошибки наклона линии регрессии) был очень похож на std_err, рассчитанный по scipy.stats.linregress.

Смежные вопросы