7
votes

Intervalles de confiance de la régression linéaire dans SQL

J'utilise un code SQL assez simple pour calculer les coefficients de la régression (interception et pente) de certains points de données (x, y), en utilisant les moindres carrés. Cela me donne une belle ligne la mieux adaptée aux données. Cependant, nous aimerions pouvoir voir les intervalles de confiance de 95% et 5% pour la ligne de meilleur ajustement (les courbes ci-dessous).

 Link Text
(Source: Curvefit.com ) SUB> P>

Ce que ces significations signifie est que la vraie ligne a une probabilité de 95% d'être inférieure à la courbe supérieure et de la probabilité de 95% d'être au-dessus de la courbe inférieure. Comment puis-je calculer ces courbes? J'ai déjà lu Wikipedia, etc. et j'ai fait des googles, mais je n'ai pas trouvé d'équations mathématiques compréhensibles pour pouvoir calculer cela. P>

Edit: Voici l'essence de ce que j'ai en ce moment. P >

--sample data
create table #lr (x real not null, y real not null)
insert into #lr values (0,1)
insert into #lr values (4,9)
insert into #lr values (2,5)
insert into #lr values (3,7)

declare @slope real
declare @intercept real

--calculate slope and intercept
select 
@slope = ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)),
@intercept = avg(y) - ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)) * avg(x)
from #lr


0 commentaires

3 Réponses :


0
votes

Essayez ce site et faites défiler jusqu'au milieu. Pour chaque point de votre meilleure ligne, vous connaissez votre Z, votre taille de l'échantillon et votre déviation STD.

http://www.stat.yale.edu /Cours/1997-98/101/confint.htm


1 commentaires

Donc c'est! Je ne me souviens pas de cela. Pardon.



0
votes

@PowerUser: il doit utiliser les équations pour des configurations à deux variables, pas pour des configurations à une variable.

Matt: Si j'avais mon ancien manuel de statistiques avec moi, je pourrais vous dire ce que vous voulez; Malheureusement, je ne l'ai pas avec moi, je n'ai ni mes notes de mon cours de statistiques sur l'école secondaire. D'autre part, à partir de ce que je me souviens que cela n'a peut-être pas eu de choses pour l'intervalle de confiance de la pente de la ligne de régression ...

Quoi qu'il en soit, cette page sera d'une aide d'une aide: http://www.stat.yale.edu/courses/1997-98/101/lindregin.htm .


0 commentaires

1
votes

Une équation pour la largeur d'intervalle de confiance en tant que f (x) est donnée ici sous "Intervalle de confiance sur les valeurs ajustées"

http://www.weibull.com/deweb/confidence_intervals_in_simple_linear_regrression.htm

La page vous traverse également un exemple de calcul.


0 commentaires