You are on page 1of 2

Ejercicio de Regresión Lineal Simple.

Sea X el volumen de lluvia (m3) y Y el volumen de escurrimiento (m3) en determinado lugar.


(Devore, 6a. Edición. Pág. 517, problema 16)
Var Indep. Var. Dep. o regresiva Bandas de confianza Bandas de predicción
No. Observ. X Y X2 Y2 XY yiestimada ei LIC LSC LIP LSP
1 5 4 25 16 20 3.0065609658 0.9934390342 -1.79026099 7.80338293 -9.28904753 15.3021695
2 12 10 144 100 120 8.7953729971 1.2046270029 4.42350582 13.1672402 -3.34075942 20.9315054
3 14 13 196 169 182 10.4493192917 2.5506807083 6.19349156 14.705147 -1.64549601 22.5441346
4 17 15 289 225 255 12.9302387337 2.0697612663 8.84321888 17.0172586 0.89378499 24.9666925
5 23 15 529 225 345 17.8920776176 -2.8920776176 14.1207035 21.6634517 5.95910857 29.8250467
6 30 25 900 625 750 23.6808896488 1.3191103512 20.2318382 27.129941 11.8458382 35.5159411
7 40 27 1600 729 1080 31.950621122 -4.950621122 28.8474511 35.0537911 20.211705 43.6895372
8 47 46 2209 2116 2162 37.7394331533 8.2605668467 34.7756243 40.703242 26.0365852 49.4422811
9 55 38 3025 1444 2090 44.3552183318 -6.3552183318 41.4286154 47.2818213 32.6617376 56.0486991
10 67 46 4489 2116 3082 54.2788960997 -8.2788960997 51.1595169 57.3982753 42.5356847 66.0221075
11 72 53 5184 2809 3816 58.4137618363 -5.4137618363 55.1357477 61.691776 46.6274196 70.2001041
12 81 70 6561 4900 5670 65.8565201622 4.1434798378 62.2018529 69.5111874 53.9599206 77.7531197
13 96 82 9216 6724 7872 78.261117372 3.738882628 73.7945743 82.7276605 66.0905589 90.4316759
14 112 99 12544 9801 11088 91.4926877291 7.5073122709 86.008974 96.9764014 78.9131963 104.072179
15 127 100 16129 10000 12700 103.897284939 -3.8972849389 97.3815516 110.413018 90.8348476 116.959722

n= 15
Sumas 798 643 63040 41999 51232 -3.197442E-14
Promedio 53.2 42.8666666667
Desv.Est. insesgada 38.346540168 32.1111166035
Varianza insesgada 1470.4571429 1031.1238095238
Sumas de cuadrados Sxx Syy Suma(Y2) Suma(X2) Sxy
20586.4 14435.7333333333 63040 41999 17024.4
Coef. de correlación, r= 0.9875570321 Intervalo de confianza para el promedio de y dado x:
Coef. de determinación, R2= 0.9752688917 <- 97.53% de la variación de Y está explicada por el modelo de regresión Si xo se fija en: 50
Bo=Y-B1*X -1.128304771 <- Ordenada al origen La estimación puntual para la respuesta media de yo es:
B1=Sxy/Sxx 0.8269731473 <- Pendiente 40.22035
SSE=Syy-B1*Sxy 357.01168409 <- Suma de cuadrados de los errores El error estándar estimado de la respuesta media es:
MSE=SSE/(n-2) 27.462437238 <- Cuadrados medios de los errores 1.35812
El intervalo de confianza de (1-a)100% es:
Si b 1=0, ó r=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y 37.28631 a 43.15439

Si a = 0.05 a/2= 0.025


La región de rechazo es: | t0 |>ta/2 2.1603686565

Prueba de Hipótesis sobre b 1: El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad. Intervalo de predicción para y dado x
Si xo se fija en: 50
H 0 : β1  0 bˆ  b1 La predicción para la respuesta yo es:
T  1 = 22.6418585332 40.22035
H 1 : β1  0 MS E El error estándar estimado de la predicción:
S xx Por lo tanto: Se rechaza Ho 5.413587
Un intervalo de predicción para yo es:
28.52501 a 51.9157
Prueba de Hipótesis sobre r el coeficiente de correlación poblacional
El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

H0 : r  0 r n2
T
H1 : r  0 1 r 2
= 22.6418585332

Por lo tanto: Se rechaza Ho

140
Gráfica de residuos
Diagrama de dispersión 10

120
8

100 f(x) = 0.8269731473x - 1.1283047708


6
R² = 0.9752688917
ei
4 Linear (ei)
80

2
Y

ei

60
0
f(x) = - 6.46883842555315E-16x + 1.85046818696305E-14
R² = 1.11022302462516E-16
40 -2

Y
Linear
-4
20 (Y)
LIC
LSC -6
LIP
0 LSP
0 20 40 60 80 100 120 140 -8
0 20 40 60 80 100 120 140
-20
-10 X
X
FORMULARIO PARA EL AJUSTE DE LA RECTA DE REGRESIÓN
POR EL MÉTODO DE MÍNIMOS CUADRADOS

Verdadera recta de regresión: Y  b 0  b1 X


Modelo lineal simple: yi  b 0  b1 xi   i  i ~ N (0,  2 )

Los i se suponen errores aleatorios con distribución normal, media cero y varianza 2;
b0 y b1 son constantes desconocidas (parámetros del modelo de regresión)
Ahora, el modelo de regresión lineal simple ajustado (o recta estimada) es:

S xy
yˆ  bˆ0  bˆ1 x donde:
bˆ0  y  bˆ1 x ˆ1 
β
S xx
Suma de cuadrados de X Suma de cuadrados de Y
2 2
 n   n 
n n
  xi    yi 
  x 2i   i 1 
n n
S xx    xi  x  S yy    yi  y    y 2i   i 1 
2 2

i 1 i 1 n i 1 i 1 n
Suma de productos cruzados de X y Y

 n  n 
n n


 y i   xi 
 i 1 
S xy   ( xi  x ) yi   xi yi  i 1

i 1 i 1 n

Coeficiente de correlación: Coeficiente de determinación:

S xy
r R 2
 r2
S xx S yy

El residuo o error en la estimación se define como: e i  y i  yˆ i


n n
SS E   ei2    yi  yˆ i 
Suma de cuadrados de los errores: 2

i 1 i 1
Cuadrado medios de los errores (o varianza residual):
n También:
  yi  yˆ i 
2
SS E SS E  S yy  b̂1S xy
MS E  i 1 
n2 n2
Estimación de la respuesta media de yo dado un xo:

ˆ Y  yˆ 0  Eˆ Y x0   bˆ0  bˆ1 x0
0

Bandas de confianza para la recta de regresión:

 1 ( x  x )2 
yˆ 0  ta / 2 ,n  2 MS E   o 
n S xx 
Bandas de predicción:

 1 ( x  x )2 
yˆ 0  ta / 2,n  2 MS E 1   o 
 n S xx 

You might also like