Я использую довольно справедливый SQL-код для вычисления коэффициентов регрессии (перехвата и наклона) некоторых (x, y) точек данных с использованием наименьших квадратов. Это дает мне хорошую линию наилучшего соответствия данных. Однако мы хотели бы видеть 95% и 5% доверительные интервалы для линии наилучшего соответствия (кривые ниже).Доверительные интервалы линейной регрессии в SQL
link text http://www.curvefit.com/2a03be60.gif
Что это значит, что истинная линия имеет 95% вероятность быть ниже верхней кривой и 95% вероятности того, чтобы быть выше нижней кривой. Как я могу рассчитать эти кривые? Я уже читал wikipedia и т. Д. И делал некоторые поисковые запросы, но я не нашел понятных математических уравнений, чтобы иметь возможность рассчитать это.
Редактировать: вот суть того, что у меня есть сейчас.
--sample data
create table #lr (x real not null, y real not null)
insert into #lr values (0,1)
insert into #lr values (4,9)
insert into #lr values (2,5)
insert into #lr values (3,7)
declare @slope real
declare @intercept real
--calculate slope and intercept
select
@slope = ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)),
@intercept = avg(y) - ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)) * avg(x)
from #lr
Заранее спасибо.
Это мертвая ссылка. – DatumPoint
Так оно и есть! Однако я не помню его. Сожалею. – PowerUser