2009-07-23 5 views
6

Я использую довольно справедливый SQL-код для вычисления коэффициентов регрессии (перехвата и наклона) некоторых (x, y) точек данных с использованием наименьших квадратов. Это дает мне хорошую линию наилучшего соответствия данных. Однако мы хотели бы видеть 95% и 5% доверительные интервалы для линии наилучшего соответствия (кривые ниже).Доверительные интервалы линейной регрессии в SQL

link text http://www.curvefit.com/2a03be60.gif

Что это значит, что истинная линия имеет 95% вероятность быть ниже верхней кривой и 95% вероятности того, чтобы быть выше нижней кривой. Как я могу рассчитать эти кривые? Я уже читал wikipedia и т. Д. И делал некоторые поисковые запросы, но я не нашел понятных математических уравнений, чтобы иметь возможность рассчитать это.

Редактировать: вот суть того, что у меня есть сейчас.

--sample data 
create table #lr (x real not null, y real not null) 
insert into #lr values (0,1) 
insert into #lr values (4,9) 
insert into #lr values (2,5) 
insert into #lr values (3,7) 

declare @slope real 
declare @intercept real 

--calculate slope and intercept 
select 
@slope = ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/ 
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)), 
@intercept = avg(y) - ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/ 
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)) * avg(x) 
from #lr 

Заранее спасибо.

ответ

0

Попробуйте этот сайт и прокрутите вниз до середины. Для каждой точки вашей линии наилучшего соответствия вы знаете свой Z, свой размер выборки и ваше отклонение std.

http://www.stat.yale.edu/Courses/1997-98/101/confint.htm

+0

Это мертвая ссылка. – DatumPoint

+0

Так оно и есть! Однако я не помню его. Сожалею. – PowerUser

0

@PowerUser: Он должен использовать уравнения для двух переменных установок, а не для одной переменных установок.

Мэтт: Если бы у меня был мой старый учебник по статистике, я мог бы рассказать вам, чего вы хотите; к сожалению, у меня его нет, и у меня нет моих заметок из моего курса средней школы. С другой стороны, из того, что я помню, у него могли быть только данные для доверительного интервала наклона линии регрессии ...

В любом случае эта страница, надеюсь, будет полезной: http://www.stat.yale.edu/Courses/1997-98/101/linregin.htm.

Смежные вопросы