You are on page 1of 13

9.

Los siguientes datos listan los precios, el nmero de pginas (P) y el tipo de encuadernacin (E), donde s =
pasta suave y d = pasta dura, de novelas publicadas por cierta editorial.

Precio P E Precio P E Precio P E Precio P E


10.25 112 s 24.50 146 d 24.75 158 d 30.50 276 d
14.25 260 s 19.75 212 d 16.50 322 s 22.75 264 d
29.25 250 d 30.25 292 d 12.50 188 s 17.75 378 s
17.50 382 s 16.25 340 s 16.75 240 s 29.50 251 d
12.00 175 s 29.00 252 d 17.50 425 s 27.50 202 d

(a) Suponga el modelo de regresin lineal simple E Y jx x; Y


( i i ) = 0 + 1 i donde i :=precio de la novela , i
xi :=nmero de pginas de la novela i
con encuadernado de pasta suave. Ajustando el modelo se obtienen las
: ; : y :
estimaciones ^0 = 8 338182 ^1 = 0 024050. As, el ajuste de mnimos cuadrados es ^ = 8 338182 + 0 024050 .: x

Figura 1.- Grca de dispersin de los datos, considerando solamente el tipo de encuadernado de pasta suave.

1
Figura 2.- Grca de dispersin y recta de regresin estimada de los datos, considerando solamente el tipo de
encuadernado de pasta suave.

De acuerdo al modelo planteado y la grca anterior, el precio promedio de una novela de entre 112 y 425 pginas
con encuadernacin de pasta suave crece conforme aumenta el nmero de pginas de sta, en aproximadamente
0.024050 unidades monetarias por pgina, y el precio del encuadernado de pasta suave es de aproximadamente
8.338182 unidades monetarias.

Por otro lado, el precio promedio estimado de una novela de 100 pginas con este tipo de encuadernado es de
aproximadamente 10.74315 unidades monetarias, mientras que el precio promedio estimado de una novela de 400
pginas es de aproximadamente 17.95805 unidades monetarias. Observe que el rango del nmero de pginas de los
datos originales est entre 112 y 425 pginas, por lo que la estimacin para una novela de 100 pginas podra no
ser adecuada.

2
(b) Suponga el modelo de regresin lineal simple E Y jx x; Y
( i i ) = 0 + 1 i donde i :=precio de la novela , i
xi :=nmero de pginas de la novela i
con encuadernado de pasta dura. Ajustando el modelo se obtienen las
: ; : y : :
estimaciones ^0 = 17 80451 ^1 = 0 03895. As, el ajuste de mnimos cuadrados es ^ = 17 80451 + 0 03895 . x

Figura 3.- Grca de dispersin de los datos, considerando solamente el tipo de encuadernado de pasta dura.

3
Figura 4.- Grca de dispersin y recta de regresin estimada de los datos, considerando solamente el tipo de
encuadernado de pasta dura.

De acuerdo al modelo planteado y la grca anterior, el precio promedio de una novela de entre 146 y 292
pginas con encuadernacin de pasta dura crece conforme aumenta el nmero de pginas de sta, en aproximada-
mente 0.03895 unidades monetarias por pgina, y el precio del encuadernado de pasta dura es de aproximadamente
17.80451 unidades monetarias.

Por otro lado, el precio promedio estimado de una novela de 100 pginas con este tipo de encuadernado es de
aproximadamente 21.69964 unidades monetarias, mientras que el precio promedio estimado de una novela de 400
pginas es de aproximadamente 33.38504 unidades monetarias. Observe que el rango del nmero de pginas de los
datos originales est entre 146 y 292 pginas, por lo que las estimaciones anteriores podran no ser adecuadas.

4
10. En la tabla siguiente se presentan datos sobre el rendimiento de gasolina en millas de 32 automviles de
marcas y modelos diferentes.

Rendimiento
y
de la gasolina ( )
x
Cilindrada ( 1 ) x
Peso ( 10 )
x
Nmero de gargantas del carburador ( 6 )
(millas/galn) (pulgadas cbicas) (libras)
18.9 350 3910 4
17 350 2860 4
20 250 3510 1
18.25 351 3890 2
20.07 225 3365 1
11.2 440 4215 4
22.12 231 3020 2
21.47 262 3180 2
34.7 89.7 1905 2
30.4 96.9 2320 2
16.5 350 3885 4
36.5 85.3 2009 2
21.5 171 2655 2
19.7 258 3375 1
20.3 140 2700 2
17.8 302 3890 2
14.39 500 5290 4
14.89 440 5185 4
17.8 350 3910 4
16.41 318 3660 2
23.54 231 3050 2
21.47 360 4250 2
16.59 400 3850 4
31.9 96.9 2275 2
29.4 140 2150 2
13.27 460 5430 4
23.9 133.6 2535 2
19.73 318 4370 2
13.9 351 4540 2
13.27 351 4715 2
13.77 360 4215 4
16.5 350 3660 4

Tabla 1.- Datos del rendimiento de la gasolina para 32 automviles.

5
(a)

Figura 5.- Grca de dispersin del rendimiento de la gasolina contra la cilindrada.

En la grca anterior se puede observar cmo el rendimiento de la gasolina decrece conforme aumenta el tamao
de la cilindrada del motor.

(b) Suponga el modelo de regresin lineal simple E (Yi jxi1 ) = 0 + 1 xi1 ; donde Yi :=rendimiento de la gaso-
lina del automvil i, xi1 :=cilindrada del motor del automvil i. Ajustando el modelo se obtienen las estimaciones
^0 = 33:727439; ^1 = 0:047428. As, el ajuste de mnimos cuadrados es
y^ = 33:727439 : x:
0 047428 1

6
Figura 6.- Grca de dispersin y recta de regresin estimada de los datos, tomando como variable respuesta el
rendimiento de la gasolina y la cilindrada del motor como nica variable regresora.

(c) La tabla de anlisis de varianza obtenida fue

Variable respuesta: Rendimiento de la gasolina


g:l: Suma de cuadrados Media cuadrtica Valor F P r(> F )
x
Cilindrada ( 1 ) 1 955.34 955.34 101.56 3.82e-11
Residuos 30 282.20 9.41

de donde se puede observar que la prueba es altamente signicativa.

(d) Para este ajuste se obtuvo R2 : ;


= 0 772 por lo que aproximadamente el 77.2 % de la variabilidad total del
rendimiento de la gasolina es explicada por el modelo con x1 como nica variable regresora.
(e) Por ltimo, el rendimiento promedio estimado de gasolina para un motor de 275 pulgadas cbicas de cilindrada
es de aproximadamente

E [Yi j^275] =20:68466


millas

galn

7
11. (a)

Figura 7.- Grca de dispersin del rendimiento de la gasolina contra el peso del automvil.

(b) Suponga el modelo de regresin lineal simple E (Yi jxi10 ) = 0 + 10 xi10 ; donde Yi :=rendimiento de la
gasolina del automvil i, xi10 :=peso del automvil i. Ajustando el modelo se obtienen las estimaciones ^0 =
:
39 962195 ; ^10 = :
0 005552. As, el ajuste de mnimos cuadrados es

y^ = 33:727439 : x :
0 047428 10

Figura 8.- Grca de dispersin y recta de regresin estimada de los datos, tomando como variable respuesta el
rendimiento de la gasolina y el peso del automvil como nica variable regresora.

8
(c) La tabla de anlisis de varianza obtenida fue

Variable respuesta: Rendimiento de la gasolina


g:l: Suma de cuadrados Media cuadrtica Valor F P r (> F )
x
Peso ( 10 ) 1 871.62 871.62 71.458 1.963e-09
Residuos 30 365.93 12.20

de donde se puede observar que la prueba es altamente signicativa.

(d) Para este ajuste se obtuvo R2 = 0:7043; por lo que aproximadamente el 70.43 % de la variabilidad total del
rendimiento de la gasolina es explicada por el modelo con x10 como nica variable regresora.
2 2
Por ltimo, si ^1 y ^2 son los estimadores de 2 del modelo de los ejercicios 10 y 11, respectivamente, se sigue
que

282 20 :
^12 =
32 2
= :
9 4067 ;
R 2
1 = 0:772;

365 93 :
^22 =
30
= 12 19767: ;
R 2
2 = :
0 7043 ;
entonces
^12  ^22
y
R12  R22 ;
lo nos dice que la suma de cuadrados de los errores es menor, y que la variabilidad del rendimiento de la gasolina
explicada por el modelo ajustado es mayor cuando se usa el tamao de la cilindrada del motor como variable
regresora. Tomando sto en cuenta, yo preferira usar el modelo que tiene el tamao de la cilindrada del motor
como variable regresora.

9
12. (a) Suponga el modelo de regresin lineal mltiple E Y jx ; x
( i i1 i6 ) = 0 + 1 i1 + 6 i6 donde i :=rendimiento x x ; Y
de la gasolina del automvil i, xi1
:=cilindrada del motor del automvil y i6 :=nmero de gargantas del car- i x
burador del automvil i . Ajustando el modelo de regresin se obtienen las estimaciones ^0 = 32 910041 ^1 = : ;
: ; :
0 053025 ^6 = 0 929500. As, el ajuste de mnimos cuadrados es ^ = 32 910041 y : : x :
0 053025 1 + 0 929500 6 . x
(b) La tabla de anlisis de varianza obtenida fue

Variable respuesta: Rendimiento de la gasolina


g:l: Suma de cuadrados Media cuadrtica Valor F P r (> F )
x
Cilindrada ( 1 ) 1 955.34 955.34 104.687 3.916e-11
Nmero de gargantas
1 17.56 17.56 1.924 0.176
del carburador ( 6 ) x
Residuos 29 264.65 9.13

entonces

SCR
F0 =
2
SCE
32 3
972:9
=
2
365:93
29

= :
53 30455

y
P r(F > F0 ) = 1:934e 10

donde F ~ F2;29 , por lo tanto, la prueba es altamente signicativa y rechazamos la hiptesis de que 1 = 6 = 0,
es decir, al menos una de las variables regresoras contiene informacin signicativa acerca de la variable respuesta.

(c) Para este ajuste se obtuvo R2 = 0:7862; por lo que aproximadamente el 78.62 % de la variabilidad total del
rendimiento de la gasolina es explicada por el modelo con x1 y x6 como variables regresoras. Este valor de R es
2
mayor al obtenido en el problema 10, y es razonable ya que este nuevo modelo es el resultado de agregar una nueva
variable regresora al modelo planteado en el problema 10.

(d) Un intervalo de conanza del 95 % para 1 est dado por


 q q 
^1 t1 =2 ^ 2 (X 0 X )111 ; ^1 + t1 =2 ^ 2 ( X 0 X )111

donde t1 =2 es el cuantil 1 =2 de la distribucin t-student con 29 grados de libertad.


Sustituyendo los datos se obtiene que el intervalo de conanza del 95 % para 1 es
( :
0 06559405 ; :
0 04045547) :
(e) Considere la prueba de hiptesis H0 : ^1 = 0 vs ^1 6= 0: El estadstico para este contraste de hiptesis es

q 1
^
T1 = ;
^ 2 ( X 0 X )111
entonces, sustituyendo los datos se obtiene
T1 = :
8 628 ;

10
por lo que

P r (jT j > jT1 j) = P r (jT j > 8:628)


= 1:68e 09;

donde T tiene distribucin t student con 29 grados de libertad, lo cual nos dice que la prueba es altamente
signicativa y por lo tanto rechazamos H0 ; es decir, la variable regresora x1 contribuye de manera altamente signi-
cativa en el modelo.

Ahora considere la prueba de hiptesis H0 : ^6 = 0 vs ^6 6= 0: El estadstico de prueba para este contraste de


hiptesis es

q 6
^
T6 = ;
^ 2 ( X 0 X )661
entonces, sustituyendo los datos se obtiene
T6 = 1:387;
por lo que

P r (jT j > jT6 j) = P r (jT j > 1:387)


= 0:176;

donde T t student con 29 grados de libertad, lo cual nos dice que la prueba no es signicativa
tiene distribucin
> 0:176 y no se rechaza la hiptesis H0 : ^6 = 0, es decir, la variable regresora x6 no
al nivel de signicancia de
contribuye de manera signicativa al modelo dado que x1 se encuentra en el modelo y se puede eliminar la variable
regresora x6 del modelo.

(f ) El rendimiento promedio estimado de gasolina para un motor de 275 pulgadas cbicas y 6 gargantas es de
23.90523 millas/galn.

(g) Por ltimo, considero que este modelo explica mejor el comportamiento de la variable respuesta, ya que la
suma de cuadrados de los residuos es menor en este modelo y a su vez, el valor de R2 es mayor.
13. (a) Suponga el modelo de regresin lineal mltiple
E (Yi jxi1 ; :::; xi9 ) = 0 + 1 xi1 + 2 xi2 + 3 xi3 + 4 xi4 + 5 xi5 + 6 xi6 + 7 xi7 + 8 xi8 + 9 xi9 ; donde

Variable Valor que representa


Y (Precio de la venta de la casa)/1000
X1 Impuestos (locales, escuela, municipal)/1000
X2 Cantidad de baos
X3 Tamao del terreno (pies cuadrados x 1000)
X4 Supercie construida (pies cuadrados x 1000)
X5 Cantidad de cajones en cochera
X6 Cantidad de habitaciones
X7 Cantidad de recmaras
X8 Edad de la casa (aos)
X9 Cantidad de chimeneas

As, el ajuste de mnimos cuadrados es

y^ = 14:92765+1:92472x1 +7:00053x2 +0:14918x3 +2:72281x4 +2:00668x5 : x


0 41012 6 : x
1 40324 7 : x : x:
0 03715 8 +1 55945 9

(b) La tabla de anlisis de varianza obtenida fue

11
(Precio de la venta de la casa)/1000
g:l: Suma de cuadrados Media cuadrtica Valor F P r(> F )
Impuestos (locales, escuela, municipal)/1000 ( 1 ) x 1 636.16 636.16 73.1525 6.238e-07
Cantidad de baos ( 2 )x 1 29.18 29.18 3.3551 0.08836
x
Tamao del terreno (pies cuadrados x 1000) ( 3 ) 1 4.71 4.71 0.5416 0.47391
Supercie construida (pies cuadrados x 1000) (x4 ) 1 0.03 0.03 0.0032 0.95537
Cantidad de cajones en cochera (x5 ) 1 8.78 8.78 1.0091 0.33216
Cantidad de habitaciones (x6 ) 1 13.03 13.03 1.4982 0.24115
Cantidad de recmaras (x7 ) 1 9.14 9.14 1.0515 0.32254
Edad de la casa (aos) (x8 ) 1 0.64 0.64 0.0741 0.78943
Cantidad de chimeneas (x9 ) 1 5.63 5.63 0.6478 0.43435
Residuos 14 121.75 8.70

entonces

SCR
F0 =
9
SCE
24 10
707:2962
=
9
121:75
14

= :
9 036867

P r(F > F0 ) = 0:000185;


donde F ~ F9;14 , por lo tanto, la prueba es signicativa para > 0:00019 y no se rechaza la hiptesis de que
de que alguno de los coecientes es distinto de cero, es decir, al menos una de las variables regresoras contiene
informacin signicativa acerca de la variable respuesta.

(c) Considere la prueba de hiptesis H0 : ^j = 0 vs ^j 6= 0; para j = 0; 1; :::; 9: El estadstico de prueba para


este contraste de hiptesis es

q j
^
Tj = ;
^ 2 X 0 X )jj1
(

y sustituyendo los datos se obtiene la siguiente tabla

Coeciente Tj P r (jT j > jTj j)



^
0 2.525 0.0243


^
1 1.869 0.0827


^
2 1.628 0.1258


^
3 0.304 0.7654


^
4 0.625 0.5423


^
5 1.461 0.1661


^
6 -0.172 0.8656


^
7 -0.413 0.6857


^
8 -0.557 0.5865


^
9 0.805 0.4343

12
de donde se puede observar que ocho de los coecientes de regresin no son signicativos, y no se rechaza la
hiptesisH0 : ^j = 0 vs ^j 6= 0; para j = 2; :::; 9: As, podemos eliminar alguna de las variables regresoras, digamos
x6 por tener el p-valor (P r (jT j > jT6 j)) ms grande, y luego analizar el modelo reducido para vericar si es posible
eliminar ms variables regresoras.

(d) De acuerdo a lo que representan las variables regresoras, yo esperara que el precio de la venta de una casa

aumente cuantas ms habitaciones y recmaras tenga, pero segn las estimaciones obtenidas, ^6 y ^7 tienen signo
negativo, lo que implicara lo contrario a lo que se espera, es decir, que el precio de la casa disminuye conforme
aumenta el nmero de habitaciones y de recmaras. Esto podra indicar que hay un error de signo en estas dos
estimaciones.

(e) Si consideramos el modelo de regresin lineal mltiple E (Yi jxi4 ; xi5 ; xi6 ; xi8 )= 0 + 4 xi4 + 5 xi5 + 6 xi6 + 8 xi8 ,
obtenemos el ajuste de mnimos cuadrados

y^ = 17:34651 + 11:45367x4 + 2:07959x5 + 0:61722x6 :


0 14209 8x;
y SCEe = 289:28 > 121:75 = SCEa y Re2 = 0:6511 < 0:8531 = Ra2 , donde SCEk y Rk2 son la suma de cuadrados
de los errores y la R obtenidas en el modelo del inciso k; kfa; eg, y aunque el modelo reducido no tiene signos
2
sospechosos en las estimaciones de sus coecientes, la variabilidad de las Yi explicada por el modelo del inciso (a)
es mucho mayor, y su suma de cuadrados de errores es menos de la mitad del modelo reducido, por lo que podra
concluir que el modelo en (a) es mejor.

13

You might also like