Я использую функцию scipy.stats.linregress сделать простую линейную регрессию на некоторых 2D данных, например:Определения стандартной ошибки в scipy.stats.linregress
from scipy import stats
x = [5.05, 6.75, 3.21, 2.66]
y = [1.65, 26.5, -5.93, 7.96]
gradient, intercept, r_value, p_value, std_err = stats.linregress(x,y)
Документация о функции говорится, что std_err
является :
Стандартная ошибка оценки
Я не уверен, что это значит. В этом old answer говорится, что он представляет стандартную ошибку градиентной линии, но это «не всегда является поведением этой библиотеки».
Могу ли я получить точное определение того, что именно представляет этот параметр?
Это стандартная мера в статистике. См. Https://en.wikipedia.org/wiki/Ordinary_least_squares#Finite_sample_properties для описания того, как его вычислить. Говоря простыми словами, это говорит о том, насколько хорошо подходит градиент (более высокие значения означают менее точный) для ваших данных. –
@JamesPringle, не могли бы вы опубликовать свой комментарий в качестве ответа, чтобы я мог его принять? – Gabriel