You are on page 1of 19

Regresin y Correlacin Lineal Simple.

1. Un comerciante al menudeo tiene los siguientes datos sobre la cantidad


invertida en publicidad (x), y su relacin con las ventas (y).
x 40 20 25 20 30 50 40 20 50 40 25 50
Y 385 400 395 365 475 440 490 420 560 525 480 510

a) Realiza el anlisis de regresin, interpreta cada resultado.

-Paso 1 (Tabla)

x y xy x2 y2
40 385 15400 1600 148225
20 400 8000 400 160000
25 395 9875 625 156025
20 365 7300 400 133225
30 475 14250 900 225625
50 440 22000 2500 193600
40 490 19600 1600 240100
20 420 8400 400 176400
50 560 28000 2500 313600
40 525 21000 1600 275625
25 480 12000 625 230400
50 510 25500 2500 260100
Sumatoria 410 5445 191325 15650 2512925

-Paso 2 (Diagrama de dispersin)

Analizando el diagrama de dispersin, se puede observar que tiene cierta


tendencia lineal.

560

510

460

410

360
15 20 25 30 35 40 45 50 55
-Paso 3 (Calcular coeficiente de correlacin r)

12(191,325) (410)(5,445)
= = 0.6348
12(15,650) (410)2 12(2,512,925) (5,445)2
Este dato indica que la relacin lineal es buena, no excelente, pero se
encuentra en el rango para considerarse buena.

-Paso 4 (Calcular coeficiente de determinacin r2)

2 = (0.6348)2 = 0.4030
El coeficiente de determinacin nos indica que nuestra relacin lineal explica el
40.30% de los casos.

-Paso 5 (Encontrar la ecuacin de regresin y trazar la recta)

12(191,325) (410)(5,445)
1 = = 3.220812183
12(15,650) (410)2
(5,445)(15,650) (410)(191,325)
0 = = 343.7055838
12(15,650) (410)2
= 343.7055 + 3.2208

560

510

460

410

360
15 20 25 30 35 40 45 50 55

-Paso 6 (Prueba de hiptesis y criterio de valor p<)

= 0.026570895 = 0.05
0.0265 < 0.05 0 ( )
Con esto demostramos con un 95% de confianza estadstica que existe
correlacin lineal entre nuestras variables.
-Paso 7 (Residuos)

Observacin Pronstico para Y Residuos


1 472.5380711 -87.53807107
2 408.1218274 -8.121827411
3 424.2258883 -29.22588832
4 408.1218274 -43.12182741
5 440.3299492 34.67005076
6 504.7461929 -64.74619289
7 472.5380711 17.46192893
8 408.1218274 11.87817259
9 504.7461929 55.25380711 Al no formar patrn alguno, se
10 472.5380711 52.46192893 comprueba que la ecuacin
11 424.2258883 55.77411168 planteada es correcta.
12 504.7461929 5.253807107

80
60
40
20
0
15 20 25 30 35 40 45 50 55
-20
-40
-60
-80
-100

-Conclusin
Con esto concluimos con que con un 95% de confianza estadstica y un
coeficiente de correlacin que explica el 40% de los casos aproximadamente de
0.6348 que existe relacin lineal entre la cantidad invertida en publicidad y las
ventas.

b) Estima las ventas esperadas para una inversin de 35 unidades


monetarias.
Dada la ecuacin: y=343.7055+3.2208x
= 343.7055 + 3.2208(35) = 456.4335
2. Se estudia la relacin lineal entre las concentraciones de ozono [x) en
ppm y la concentracin secundaria de carbono (y) en g/m3;
x Y
0.066 4.6
0.088 11.6
0.120 9.5
0.050 6.3
0.162 13.8
0.186 15.4
0.057 2.5
0.100 11.8
0.112 8
0.055 7
0.154 20.6
0.074 16.6
0.111 9.2
0.140 17.9
0.071 2.8
0.110 13

a) A partir de estos datos estima por medio de regresin, la concentracin


secundaria de carbono esperada para una concentracin de ozono de
0.095 ppm.
Dada la ecuacin y=0.9980+93.3767x
= 0.9980 + 93.3767(0.095) = 9.8687
b) Realiza el anlisis de regresin, interpretando cada resultado.
-Paso 1 (Tabla)

x y xy x2 y2
0.066 4.6 0.3036 0.004356 21.16
0.088 11.6 1.0208 0.007744 134.56
0.12 9.5 1.14 0.0144 90.25
0.05 6.3 0.315 0.0025 39.69
0.162 13.8 2.2356 0.026244 190.44
0.186 15.4 2.8644 0.034596 237.16
0.057 2.5 0.1425 0.003249 6.25
0.1 11.8 1.18 0.01 139.24
0.112 8 0.896 0.012544 64
0.055 7 0.385 0.003025 49
0.154 20.6 3.1724 0.023716 424.36
0.074 16.6 1.2284 0.005476 275.56
0.111 9.2 1.0212 0.012321 84.64
0.14 17.9 2.506 0.0196 320.41
0.071 2.8 0.1988 0.005041 7.84
0.11 13 1.43 0.0121 169
Sumatoria 1.224 127.7 14.8837 0.14785 1671.67
-Paso 2 (Diagrama de dispersin)

Analizando el diagrama de dispersin, se puede observar que tiene cierta


tendencia lineal.
25

20

15

10

0
0.03 0.08 0.13 0.18 0.23

-Paso 3 (Calcular coeficiente de correlacin r)

16(14.8837) (1.224)(127.7)
= = 0.7155
16(0.14785) (1.224)2 16(1,671.67) (127.7)2
Este dato indica que la relacin lineal es buena, no excelente, pero se
encuentra en el rango para considerarse buena.

-Paso 4 (Calcular coeficiente de determinacin r2)

2 = (0.7155)2 = 0.5119
El coeficiente de determinacin nos indica que nuestra relacin lineal explica el
51.19% de los casos.

-Paso 5 (Encontrar la ecuacin de regresin y trazar la recta)

16(14.8837) (1.224)(127.7)
1 = = 93.37670481
16(0.14785) (1.224)2
(127.7)(0.14785) (1.224)(14.8837)
0 = = 0.998011052
16(0.14785) (1.224)2
= 0.9980 + 93.3767
25

20

15

10

0
0.03 0.05 0.07 0.09 0.11 0.13 0.15 0.17 0.19

-Paso 6 (Prueba de hiptesis y criterio de valor p<)

= 0.001829636 = 0.05
0.0018 < 0.05 0 ( )
Con esto demostramos con un 95% de confianza estadstica que existe
correlacin lineal entre nuestras variables.

-Paso 7 (Residuos)

Observacin Pronstico para Y Residuos


1 7.16087357 -2.56087357
2 9.21516108 2.38483892
3 12.2032156 -2.70321563
4 5.66684629 0.63315371
5 16.1250372 -2.32503723
6 18.3660781 -2.96607815
7 6.32048323 -3.82048323
8 10.3356815 1.46431847
9 11.456202 -3.45620199
10 6.13372982 0.86627018
11 15.3780236 5.22197641
12 7.90788721 8.69211279
13 11.3628253 -2.16282529
14 14.0707497 3.82925027
15 7.62775709 -4.82775709 Al no formar patrn alguno, se
16 11.2694486 1.73055142 comprueba que la ecuacin planteada
es correcta.
10

0
0.03 0.05 0.07 0.09 0.11 0.13 0.15 0.17 0.19 0.21
-2

-4

-6

-Conclusin
Con esto concluimos con que con un 95% de confianza estadstica y un
coeficiente de correlacin que explica el 50% de los casos aproximadamente de
0.7155 que existe relacin lineal entre la concentracin de ozono y la
concentracin secundaria de carbono.

c) Calcular el valor de x para y=10.


Dada la ecuacin y=0.9980+93.3767x
10 0.9980
= = 0.0964
93.3767

3. Se considera que los metros cbicos de gas consumidos al mes en una


planta qumica dependen de la temperatura mensual promedio de
operacin del equipo. El consumo y la temperatura del ao pasado se
muestran en la siguiente tabla;
Temperatura Consumo Temperatura Consumo
(C) (m3) (C) (m3)
Ene 21 185.79 Jul 68 621.55
Feb 24 214.47 Ago 74 675.06
Mar 32 288.03 Sep 62 562.03
Abr 47 424.84 Oct 50 452.93
May 50 454.48 Nov 41 369.95
Jun 59 539.03 Dic 30 273.98

a) Escribe el modelo de regresin lineal simple obtenido con esta


muestra

-Paso 1 (Tabla)
x y xy x2 y2
21 185.79 3901.59 441 34517.9241
24 214.47 5147.28 576 45997.3809
32 288.03 9216.96 1024 82961.2809
47 424.84 19967.48 2209 180489.026
50 454.48 22724 2500 206552.07
59 539.03 31802.77 3481 290553.341
68 621.55 42265.4 4624 386324.403
74 675.06 49954.44 5476 455706.004
62 562.03 34845.86 3844 315877.721
50 452.93 22646.5 2500 205145.585
41 369.95 15167.95 1681 136863.003
30 273.98 8219.4 900 75065.0404
Sumatoria 558 5062.14 265859.63 29256 2416052.78

-Paso 2 (Diagrama de dispersin)

Analizando el diagrama de dispersin, se puede observar que tiene una


tendencia lineal casi perfecta.
750

650

550

450

350

250

150
18 28 38 48 58 68 78

-Paso 3 (Calcular coeficiente de correlacin r)

12(265,859.63) (558)(5,062.14)
= = 0.9999
12(29,256) (558)2 12(2,416,052.78) (5,062.14)2
Este dato indica que la relacin lineal es excelente, ya que se acerca a 1 con
una diferencia muy baja.

-Paso 4 (Calcular coeficiente de determinacin r2)


2 = (0.9999)2 = 0.9998
El coeficiente de determinacin nos indica que nuestra relacin lineal explica el
99.98% de los casos.

-Paso 5 (Encontrar la ecuacin de regresin y trazar la recta)

12(265,859.63) (558)(5,062.14)
1 = = 9.208256271
12(29,256) (558)2
(5,062.14)(29,256) (558)(265,859.63)
0 = = 6.338916591
12(29,256) (558)2
= 6.3389 + 9.2082

700
600
500
400
300
200
100
18 28 38 48 58 68 78

-Paso 6 (Prueba de hiptesis y criterio de valor p<)

=1.0708620 =0.05
0.0000 < 0.05 0 ( )

Con esto demostramos con un 95% de confianza estadstica que existe


correlacin lineal excelente entre nuestras variables.

-Paso 7 (Residuos) Al no formar patrn alguno, se


comprueba que la ecuacin
planteada es correcta.
Observacin Pronstico para Y Residuos
1 187.034465 -1.2444651
2 214.659234 -0.18923391
3 288.325284 -0.29528407
4 426.449128 -1.60912814
5 454.073897 0.40610305
6 536.948203 2.08179662
7 619.82251 1.72749018
8 675.072047 -0.01204745
9 564.572972 -2.5429722
10 454.073897 -1.14389695
11 371.199591 -1.24959051
12 269.908772 4.07122847

5
4
3
2
1
0
-1 20 30 40 50 60 70 80

-2
-3

-Conclusin
Con esto concluimos con que con un 95% de confianza estadstica y un
coeficiente de correlacin que explica el 99.98% de los casos de 0.9999 que
existe relacin lineal entre los metros cbicos de gas consumidos y la
temperatura promedio de los meses.

b) Cul sera el consumo aproximado de metros cbicos de gas para


una temperatura mensual promedio de operacin de 65C?

Dada la ecuacin y=-6.3389+9.2082x


= 6.3389 + 9.2082(65) = 592.1941

c) En qu porcentaje explica este modelo la variacin de consumo


como una consecuencia de la temperatura del equipo?

99.98%

4. En cierta carrera de ingeniera la asignatura Estadstica Bsica es


prerrequisito para cursar Control Estadstico de la Calidad. Se muestran
las calificaciones finales de 20 estudiantes. Se asume que una buena
calificacin en estadstica tiene que ver con un buen desempeo en
Control.
Estadstica Control
86 80
75 81
69 75
75 81
90 92
94 95
83 80
86 81
71 76
65 72
84 85
71 72
62 64
90 93
83 81
75 70
71 73
76 72
84 80
97 98
a) Encuentra la ecuacin de regresin que modela la relacin entre la
calificacin en Estadstica con la calificacin de Control.

y=13.9459+0.8330x

b) Realiza el anlisis de regresin, interpreta cada resultado.

-Paso 1 (Tabla)

x y xy x2 y2
86 80 6880 7396 6400
75 81 6075 5625 6561
69 75 5175 4761 5625
75 81 6075 5625 6561
90 92 8280 8100 8464
94 95 8930 8836 9025
83 80 6640 6889 6400
86 81 6966 7396 6561
71 76 5396 5041 5776
65 72 4680 4225 5184
84 85 7140 7056 7225
71 72 5112 5041 5184
62 64 3968 3844 4096
90 93 8370 8100 8649
83 81 6723 6889 6561
75 70 5250 5625 4900
71 73 5183 5041 5329
76 72 5472 5776 5184
84 80 6720 7056 6400
97 98 9506 9409 9604
Sumatoria 949 970 77349 75991 78966

-Paso 2 (Diagrama de dispersin)

Analizando el diagrama de dispersin, se puede observar que tiene cierta


tendencia lineal.
100

95

90

85

80

75

70

65

60
55 65 75 85 95 105

-Paso 3 (Calcular coeficiente de correlacin r)


20(77,349) (949)(970)
= = 0.9045
20(75,991) (949)2 20(78,966) (970)2

Este dato indica que la relacin lineal es excelente, ya que se acerca a 1, eso
indica que nuestra relacin es excelente.
-Paso 4 (Calcular coeficiente de determinacin r2)
2 = (0.9045)2 = 0.8181

El coeficiente de determinacin nos indica que nuestra relacin lineal explica el


81.81% de los casos.
-Paso 5 (Encontrar la ecuacin de regresin y trazar la recta)
20(77,349) (949)(970)
1 = = 0.833069818
20(75,991) (949)2
(970)(75,991) (949)(77,349)
0 = = 13.94590996
20(75,991) (949)2
= 13.9459 + 0.8330
100

90

80

70

60
55 60 65 70 75 80 85 90 95 100

-Paso 6 (Prueba de hiptesis y criterio de valor p<)


=4.4013708 =0.05
0.0000 < 0.05 0 ( )
Con esto demostramos con un 95% de confianza estadstica que existe
correlacin lineal entre nuestras variables.
-Paso 7 (Residuos)
Observacin Pronstico para Y Residuos
1 85.5899143 -5.58991429
2 76.4261463 4.57385371
3 71.4277274 3.57227261
4 76.4261463 4.57385371
5 88.9221936 3.07780644
6 92.2544728 2.74552717
7 83.0907048 -3.09070483
8 85.5899143 -4.58991429
9 73.093867 2.90613298
10 68.0954481 3.90455188
11 83.9237747 1.07622535
12 73.093867 -1.09386702
13 65.5962387 -1.59623866
14 88.9221936 4.07780644
15 83.0907048 -2.09070483
16 76.4261463 -6.42614629
17 73.093867 -0.09386702 Al no formar patrn alguno, se
18 77.2592161 -5.25921611 comprueba que la ecuacin planteada
19 83.9237747 -3.92377465 es correcta.
20 94.7536823 3.24631772
8
6
4
2
0
-2 60 65 70 75 80 85 90 95 100
-4
-6
-8

-Conclusin
Con esto concluimos con que con un 95% de confianza estadstica y un
coeficiente de correlacin que explica el 81.81% de los casos de 0.9045 que
existe relacin lineal entre la calificacin de Estadstica y la de Control
estadstico de la calidad.

c) Estima qu calificacin se esperara en Control para una calificacin


de 88 en Estadstica.

Dada la ecuacin y=13.9459+0.8330x

= 13.9459 + 0.8330(88) = 87.2499

5. Los siguientes datos reflejan la informacin obtenida en 17 hospitales


de la marina, ubicados en diversos sitios del mundo. Los regresores son
variables de la carga de trabajo, es decir, conceptos que dan como
resultado la necesidad de personal en un hospital. A continuacin se
presenta una descripcin breve de las variables:
X1= Horas de trabajo mensuales.
X2= Carga diaria promedio de pacientes.
X3= Exposiciones de rayos X mensuales.
X4= Das-cama ocupados por mes.
X5= Poblacin elegible en el rea/1000.
X6= Duracin promedio de la estancia de un paciente en das.
Sitio X1 X2 X3 X4 X5 y
1 15.57 2463 472.92 18.0 4.45 566.52
2 44.02 2048 1339.75 9.5 6.92 696.82
3 20.42 3940 620.25 12.8 4.28 1033.15
4 18.74 6505 568.33 36.7 3.90 1003.62
5 49.20 5723 1497.60 35.7 5.50 1611.37
6 44.92 11520 1365.83 24.0 4.60 1613.27
7 55.48 5779 1687.00 43.3 5.62 1854.17
8 59.28 5969 1639.92 46.7 5.15 2160.55
9 94.39 8461 2872.33 78.7 6.18 2305.58
10 128.02 20106 3655.08 180.5 6.15 3503.93
11 96.00 13313 2912.00 60.9 5.88 3571.59
12 131.42 10771 3921.00 103.7 4.88 3741.40
13 127.21 15543 3865.67 126.8 5.50 4026.52
14 252.90 36194 7684.10 157.7 7.00 10343.81
15 409.20 34703 12446.33 169.4 10.75 11732.17
16 463.70 39204 14098.40 331.4 7.05 15414.94
17 510.22 86533 15524.00 371.6 6.35 18854.45
a) El objetivo es generar una ecuacin emprica para estimar (o
predecir) las necesidades de personal en los hospitales de la
marina. Calcule la mejor ecuacin de regresin lineal mltiple,
justifique.

*Coeficiente de correlacin: 0.995572877.


*R^2 ajustado: 0.987149606 = 98.71% de los casos.

*P = 6.5876E-11
0.0000<0.05 0 ( o ).

* = 1710.767946 9.624867621(1) + 0.056276631(2) +


1.377186841(3) 3.988143586(4) 358.0027708(5)

*Se concluye con una confianza estadstica del 95% que existe una
correlacin lineal entre las variables y la necesidad de personal en
los hospitales de la marina, est basada en un coeficiente de
correlacin de 0.9955, que explica el 98.71% de los casos.
6. Con el fin de determinar la relacin entre la calificacin de su
desempeo laboral (y) y las calificaciones en cuatro exmenes, el
departamento de personal de cierta empresa industrial realiz un
estudio en el que participaron 12 sujetos. Los datos son los siguientes:
Y X1 X2 X3 X4
11.2 56.5 71.0 38.5 43.0
14.5 59.5 72.5 38.2 44.8
17.2 69.2 76.0 42.5 49.0
17.8 74.5 79.5 43.4 56.3
19.3 81.2 84.0 47.5 60.2
24.5 88.0 86.2 47.4 62.0
21.2 78.2 80.5 44.5 58.1
16.9 69.0 72.0 41.8 48.1
14.8 58.1 68.0 42.1 46.0
20.0 80.5 85.0 48.1 60.3
13.2 58.3 71.0 37.5 47.1
22.5 84.0 87.2 51.0 65.2
a) Calcule la mejor ecuacin de regresin lineal mltiple, justifique.
*Coeficiente de correlacin: 0.969024803.

*R^2 ajustado: 0.904157107 = 90.41% de los casos.

*P = 0.000240179
0.0002<0.05 0 ( )

* = 3.320458722 + 0.421048783(1) 0.295779556(2) +


0.016380034(3) +0.124652194(x4)

*Se concluye con una confianza estadstica del 95% que existe una
correlacin lineal entre las calificaciones de los exmenes y el
desempeo laboral, estando justificada con un coeficiente de correlacin
de 0.9690, el cual es excelente por ser cercano a 1, adem{as de explicar
el 90.41% de los casos.

7. Realice un ensayo de Regresin lineal mltiple.

Regresin lineal mltiple

El modelo de regresin lineal mltiple, es un modelo de regresin donde interviene ms de una


variable. A diferencia del modelo de regresin lineal simple donde se analizan una variable
dependiente y una independiente, en el modelo de regresin mltiple expresa una relacin entre
una variables dependiente (y), y dos o ms variables independientes (x1, x2, x3,..,xk). Sus
elementos clave son:

-La ecuacin de regresin lineal mltiple ( = 0+ 1 1 + 2 2 + . . + ).

-El valor de R^2 ajustada (Se hablar ms adelante).

-El valor de P (De igual manera se tocar ms adelante).

Modelo de regresin mltiple

Este modelo se utiliza para encontrar la relacin (preferentemente lineal) entra ms de dos
variables, las cuales pueden ser desde 2 hasta las que se quieran analizar sin lmite, esto a menudo
se utiliza para determinar datos que son difciles de encontrar y deducir o aproximar mediciones
tales como los litros que fluyen de un lquido a cierta presin y temperatura, entre otros ms.
(Cabe destacar que todas las mediciones deben ser cuantitativas).

A lo que se pretende llegar con la regresin lineal mltiple es a una ecuacin que, como se
mencion anteriormente, prediga o aproxime una medicin a lo que realmente se puede obtener.
Dicha ecuacin se obtiene mediante clculos que realmente son muy complicados, por lo regular,
los encargados de aplicarla, utilizan un software especializado para hacer sus clculos. Una vez
realizados estos, se obtendr una ecuacin con la forma mencionada anteriormente ( =
0+ 1 1 + 2 2 + . . + ), si dicha ecuacin de regresin mltiple se ajusta bien a los
datos muestrales, esta resultar til para hacer predicciones.

Para realizar un anlisis de regresin lineal mltiple se hacen las siguientes consideraciones sobre
los datos:

a) Linealidad: los valores de la variable dependiente estn generados por el modelo lineal y=mx+b.

b) Homocedasticidad: todas las perturbaciones tienen las misma varianza.

c) Independencia: las perturbaciones aleatorias son independientes entre s.

d) Normalidad: la distribucin de la perturbacin aleatoria tiene distribucin normal

e) Las variables explicativas Xk se obtienen sin errores de medida.

R^2 Ajustada

En el modelo de regresin lineal simple, se define a R^2 como el coeficiente de determinacin, la


cual es una medida que nos determina qu tan bien (en porcentaje) se ajusta la ecuacin de
regresin lineal a los daros muestrales.

En regresin lineal mltiple es exactamente lo mismo y se siguen los mismos criterios; un ajuste
que es perfecto dara como resultado R^2= 1, que en cuestiones de porcentaje sera el 100%, un
ajuste muy bueno da como resultado un valor cercano a 1 y mayor a 0.8, un ajuste bueno dara
como valor resultante uno que se encontrase entre 0.8 y 0.5, por el otro lado, un ajuste muy
pobre se relaciona con una valor de R^2 cercano a 0 desde 0.5.

Sin embargo el coeficiente mltiple de determinacin R^2 tiene una grave desventaja: cuanto
mayor es el nmero de variables incluidas en el anlisis, esta se incrementa. La R^2 de mayor valor
se obtiene por el hecho de que se incluyen todas la variables disponibles, pero la mejor ecuacin
de regresin mltiple no necesariamente utiliza todas las variables de las que se dispone.

Debido a este inconveniente las ecuaciones de regresin mltiple se logran mejor con el
coeficiente ajustado de determinacin; R^2 ajustada, la cual, como su nombre lo dice, se ajusta al
nmero de variables y al tamao de la muestra. Es el coeficiente mltiple para justificar el nmero
de variables y el tamao de la muestra. Esta se calcula de la siguiente manera:

( 1)
2 = 1 (1 2 )
{ ( + 1)}

Donde: n = Tamao de la muestra, k = Nmero de variables independientes (x).


Valor P

El valor P es una medida de la significancia general de la ecuacin de regresin mltiple. Este valor,
al igual que R^2, es una buena medida de qu tan bien se ajusta la ecuacin a los datos
muestrales. El grado de significancia se obtiene mediante la comparacin de dicho valor P con la
significancia (1-la confianza), mediante la prueba de hiptesis H0: no existe correlacin lineal y HA:
existe correlacin lineal, si P<Significancia, H0 se rechaza, por lo tanto existe una correlacin lineal
y entre el valor est ms alejado, mejor ser esta correlacin.

La determinacin de la mejor ecuacin de regresin lineal mltiple requiere una gran dosis de
juicio, no existe un procedimiento exacto y automtico, sin embargo, para conseguir una buena
ecuacin se deben tomar en cuenta los siguientes putnos:

-Usar el sentido comn para incluir o excluir las variables, esto es importante para no tener
medidas innecesarias o que pueden ser muy difciles de determinar.

- Considerar el valo P, considerar la mejor de las P, ya sea la general o de alguna de las variables,
que se ajuste de mejor manera a la significancia.

-No utilizar todas las variables disponibles, se debe ser selectivo e incluir solo unas cuantas. Estas
deben cuidar que al incluir una variable independiente adicional no incremente el valor de R^2 de
manera sustancial. Para deshacerse de aquellas que no tengan mucha relacin con lo que se desea
obtener, es til determinar el coeficiente de correlacin para cada par de variables que se tomen a
consideracin, para con esto, descartar las que tengan menor.

En conclusin, la regresin lineal mltiple sirve para determinar ciertas medidas que no son fciles
de obtener en base a medidas que realmente lo son, sin embargo, se debe tener mucho cuidado al
momento de seleccionar dichas medidas, as como tomar en cuenta a las medidas R^2 y P, que
son muy tiles para guiar y determinar qu tan bien explica nuestra ecuacin el fenmeno que
queremos analizar, adems de tomar en cuenta que: debe tener sentido numrico, no deber de
haber variables repetidas o redundantes, las variables introducidas en el modelo debern de tener
una cierta justificacin terica o un por qu de estar ah, la relacin entre variables explicativas en
el modelo y casos debe de ser como mnimo de 1 a 10, de lo contrario, como mencionamos
anteriormente R^2 tendera a ser muy grande, la relacin de las variables explicativas con la
variable dependiente debe de ser lineal, es decir, proporcional.

Fuentes consultadas:

- J. M. Rojo Abun . (2007). Regresin lineal mltiple. 19/11/2017, de Instituto de Economa y


Geografa Sitio web:
https://s3.amazonaws.com/academia.edu.documents/36787341/REGRESION_LINEAL_MULTIPLE_
3.PDF?AWSAccessKeyId=AKIAIWOWYYGZ2Y53UL3A&Expires=1511149062&Signature=r65VE7c4Yu
WD4%2FDT6PNted9vV0A%3D&response-content-
disposition=inline%3B%20filename%3DRegresion_lineal_multiple.pdf
- Mario F. Triola. (2004). Estadstica. Mxico: Pearson Educacin. Pginas 541-550.

- Douglas C. Montgomery, Elizabeth A. Peck, G. Geoffrey Vining. (2002). Introduccin al anlisis de


regresin lineal. Mxico: Compaa editorial Continental. Pginas 61-64.

You might also like