Professional Documents
Culture Documents
-Paso 1 (Tabla)
x y xy x2 y2
40 385 15400 1600 148225
20 400 8000 400 160000
25 395 9875 625 156025
20 365 7300 400 133225
30 475 14250 900 225625
50 440 22000 2500 193600
40 490 19600 1600 240100
20 420 8400 400 176400
50 560 28000 2500 313600
40 525 21000 1600 275625
25 480 12000 625 230400
50 510 25500 2500 260100
Sumatoria 410 5445 191325 15650 2512925
560
510
460
410
360
15 20 25 30 35 40 45 50 55
-Paso 3 (Calcular coeficiente de correlacin r)
12(191,325) (410)(5,445)
= = 0.6348
12(15,650) (410)2 12(2,512,925) (5,445)2
Este dato indica que la relacin lineal es buena, no excelente, pero se
encuentra en el rango para considerarse buena.
2 = (0.6348)2 = 0.4030
El coeficiente de determinacin nos indica que nuestra relacin lineal explica el
40.30% de los casos.
12(191,325) (410)(5,445)
1 = = 3.220812183
12(15,650) (410)2
(5,445)(15,650) (410)(191,325)
0 = = 343.7055838
12(15,650) (410)2
= 343.7055 + 3.2208
560
510
460
410
360
15 20 25 30 35 40 45 50 55
= 0.026570895 = 0.05
0.0265 < 0.05 0 ( )
Con esto demostramos con un 95% de confianza estadstica que existe
correlacin lineal entre nuestras variables.
-Paso 7 (Residuos)
80
60
40
20
0
15 20 25 30 35 40 45 50 55
-20
-40
-60
-80
-100
-Conclusin
Con esto concluimos con que con un 95% de confianza estadstica y un
coeficiente de correlacin que explica el 40% de los casos aproximadamente de
0.6348 que existe relacin lineal entre la cantidad invertida en publicidad y las
ventas.
x y xy x2 y2
0.066 4.6 0.3036 0.004356 21.16
0.088 11.6 1.0208 0.007744 134.56
0.12 9.5 1.14 0.0144 90.25
0.05 6.3 0.315 0.0025 39.69
0.162 13.8 2.2356 0.026244 190.44
0.186 15.4 2.8644 0.034596 237.16
0.057 2.5 0.1425 0.003249 6.25
0.1 11.8 1.18 0.01 139.24
0.112 8 0.896 0.012544 64
0.055 7 0.385 0.003025 49
0.154 20.6 3.1724 0.023716 424.36
0.074 16.6 1.2284 0.005476 275.56
0.111 9.2 1.0212 0.012321 84.64
0.14 17.9 2.506 0.0196 320.41
0.071 2.8 0.1988 0.005041 7.84
0.11 13 1.43 0.0121 169
Sumatoria 1.224 127.7 14.8837 0.14785 1671.67
-Paso 2 (Diagrama de dispersin)
20
15
10
0
0.03 0.08 0.13 0.18 0.23
16(14.8837) (1.224)(127.7)
= = 0.7155
16(0.14785) (1.224)2 16(1,671.67) (127.7)2
Este dato indica que la relacin lineal es buena, no excelente, pero se
encuentra en el rango para considerarse buena.
2 = (0.7155)2 = 0.5119
El coeficiente de determinacin nos indica que nuestra relacin lineal explica el
51.19% de los casos.
16(14.8837) (1.224)(127.7)
1 = = 93.37670481
16(0.14785) (1.224)2
(127.7)(0.14785) (1.224)(14.8837)
0 = = 0.998011052
16(0.14785) (1.224)2
= 0.9980 + 93.3767
25
20
15
10
0
0.03 0.05 0.07 0.09 0.11 0.13 0.15 0.17 0.19
= 0.001829636 = 0.05
0.0018 < 0.05 0 ( )
Con esto demostramos con un 95% de confianza estadstica que existe
correlacin lineal entre nuestras variables.
-Paso 7 (Residuos)
0
0.03 0.05 0.07 0.09 0.11 0.13 0.15 0.17 0.19 0.21
-2
-4
-6
-Conclusin
Con esto concluimos con que con un 95% de confianza estadstica y un
coeficiente de correlacin que explica el 50% de los casos aproximadamente de
0.7155 que existe relacin lineal entre la concentracin de ozono y la
concentracin secundaria de carbono.
-Paso 1 (Tabla)
x y xy x2 y2
21 185.79 3901.59 441 34517.9241
24 214.47 5147.28 576 45997.3809
32 288.03 9216.96 1024 82961.2809
47 424.84 19967.48 2209 180489.026
50 454.48 22724 2500 206552.07
59 539.03 31802.77 3481 290553.341
68 621.55 42265.4 4624 386324.403
74 675.06 49954.44 5476 455706.004
62 562.03 34845.86 3844 315877.721
50 452.93 22646.5 2500 205145.585
41 369.95 15167.95 1681 136863.003
30 273.98 8219.4 900 75065.0404
Sumatoria 558 5062.14 265859.63 29256 2416052.78
650
550
450
350
250
150
18 28 38 48 58 68 78
12(265,859.63) (558)(5,062.14)
= = 0.9999
12(29,256) (558)2 12(2,416,052.78) (5,062.14)2
Este dato indica que la relacin lineal es excelente, ya que se acerca a 1 con
una diferencia muy baja.
12(265,859.63) (558)(5,062.14)
1 = = 9.208256271
12(29,256) (558)2
(5,062.14)(29,256) (558)(265,859.63)
0 = = 6.338916591
12(29,256) (558)2
= 6.3389 + 9.2082
700
600
500
400
300
200
100
18 28 38 48 58 68 78
=1.0708620 =0.05
0.0000 < 0.05 0 ( )
5
4
3
2
1
0
-1 20 30 40 50 60 70 80
-2
-3
-Conclusin
Con esto concluimos con que con un 95% de confianza estadstica y un
coeficiente de correlacin que explica el 99.98% de los casos de 0.9999 que
existe relacin lineal entre los metros cbicos de gas consumidos y la
temperatura promedio de los meses.
99.98%
y=13.9459+0.8330x
-Paso 1 (Tabla)
x y xy x2 y2
86 80 6880 7396 6400
75 81 6075 5625 6561
69 75 5175 4761 5625
75 81 6075 5625 6561
90 92 8280 8100 8464
94 95 8930 8836 9025
83 80 6640 6889 6400
86 81 6966 7396 6561
71 76 5396 5041 5776
65 72 4680 4225 5184
84 85 7140 7056 7225
71 72 5112 5041 5184
62 64 3968 3844 4096
90 93 8370 8100 8649
83 81 6723 6889 6561
75 70 5250 5625 4900
71 73 5183 5041 5329
76 72 5472 5776 5184
84 80 6720 7056 6400
97 98 9506 9409 9604
Sumatoria 949 970 77349 75991 78966
95
90
85
80
75
70
65
60
55 65 75 85 95 105
Este dato indica que la relacin lineal es excelente, ya que se acerca a 1, eso
indica que nuestra relacin es excelente.
-Paso 4 (Calcular coeficiente de determinacin r2)
2 = (0.9045)2 = 0.8181
90
80
70
60
55 60 65 70 75 80 85 90 95 100
-Conclusin
Con esto concluimos con que con un 95% de confianza estadstica y un
coeficiente de correlacin que explica el 81.81% de los casos de 0.9045 que
existe relacin lineal entre la calificacin de Estadstica y la de Control
estadstico de la calidad.
*P = 6.5876E-11
0.0000<0.05 0 ( o ).
*Se concluye con una confianza estadstica del 95% que existe una
correlacin lineal entre las variables y la necesidad de personal en
los hospitales de la marina, est basada en un coeficiente de
correlacin de 0.9955, que explica el 98.71% de los casos.
6. Con el fin de determinar la relacin entre la calificacin de su
desempeo laboral (y) y las calificaciones en cuatro exmenes, el
departamento de personal de cierta empresa industrial realiz un
estudio en el que participaron 12 sujetos. Los datos son los siguientes:
Y X1 X2 X3 X4
11.2 56.5 71.0 38.5 43.0
14.5 59.5 72.5 38.2 44.8
17.2 69.2 76.0 42.5 49.0
17.8 74.5 79.5 43.4 56.3
19.3 81.2 84.0 47.5 60.2
24.5 88.0 86.2 47.4 62.0
21.2 78.2 80.5 44.5 58.1
16.9 69.0 72.0 41.8 48.1
14.8 58.1 68.0 42.1 46.0
20.0 80.5 85.0 48.1 60.3
13.2 58.3 71.0 37.5 47.1
22.5 84.0 87.2 51.0 65.2
a) Calcule la mejor ecuacin de regresin lineal mltiple, justifique.
*Coeficiente de correlacin: 0.969024803.
*P = 0.000240179
0.0002<0.05 0 ( )
*Se concluye con una confianza estadstica del 95% que existe una
correlacin lineal entre las calificaciones de los exmenes y el
desempeo laboral, estando justificada con un coeficiente de correlacin
de 0.9690, el cual es excelente por ser cercano a 1, adem{as de explicar
el 90.41% de los casos.
Este modelo se utiliza para encontrar la relacin (preferentemente lineal) entra ms de dos
variables, las cuales pueden ser desde 2 hasta las que se quieran analizar sin lmite, esto a menudo
se utiliza para determinar datos que son difciles de encontrar y deducir o aproximar mediciones
tales como los litros que fluyen de un lquido a cierta presin y temperatura, entre otros ms.
(Cabe destacar que todas las mediciones deben ser cuantitativas).
A lo que se pretende llegar con la regresin lineal mltiple es a una ecuacin que, como se
mencion anteriormente, prediga o aproxime una medicin a lo que realmente se puede obtener.
Dicha ecuacin se obtiene mediante clculos que realmente son muy complicados, por lo regular,
los encargados de aplicarla, utilizan un software especializado para hacer sus clculos. Una vez
realizados estos, se obtendr una ecuacin con la forma mencionada anteriormente ( =
0+ 1 1 + 2 2 + . . + ), si dicha ecuacin de regresin mltiple se ajusta bien a los
datos muestrales, esta resultar til para hacer predicciones.
Para realizar un anlisis de regresin lineal mltiple se hacen las siguientes consideraciones sobre
los datos:
a) Linealidad: los valores de la variable dependiente estn generados por el modelo lineal y=mx+b.
R^2 Ajustada
En regresin lineal mltiple es exactamente lo mismo y se siguen los mismos criterios; un ajuste
que es perfecto dara como resultado R^2= 1, que en cuestiones de porcentaje sera el 100%, un
ajuste muy bueno da como resultado un valor cercano a 1 y mayor a 0.8, un ajuste bueno dara
como valor resultante uno que se encontrase entre 0.8 y 0.5, por el otro lado, un ajuste muy
pobre se relaciona con una valor de R^2 cercano a 0 desde 0.5.
Sin embargo el coeficiente mltiple de determinacin R^2 tiene una grave desventaja: cuanto
mayor es el nmero de variables incluidas en el anlisis, esta se incrementa. La R^2 de mayor valor
se obtiene por el hecho de que se incluyen todas la variables disponibles, pero la mejor ecuacin
de regresin mltiple no necesariamente utiliza todas las variables de las que se dispone.
Debido a este inconveniente las ecuaciones de regresin mltiple se logran mejor con el
coeficiente ajustado de determinacin; R^2 ajustada, la cual, como su nombre lo dice, se ajusta al
nmero de variables y al tamao de la muestra. Es el coeficiente mltiple para justificar el nmero
de variables y el tamao de la muestra. Esta se calcula de la siguiente manera:
( 1)
2 = 1 (1 2 )
{ ( + 1)}
El valor P es una medida de la significancia general de la ecuacin de regresin mltiple. Este valor,
al igual que R^2, es una buena medida de qu tan bien se ajusta la ecuacin a los datos
muestrales. El grado de significancia se obtiene mediante la comparacin de dicho valor P con la
significancia (1-la confianza), mediante la prueba de hiptesis H0: no existe correlacin lineal y HA:
existe correlacin lineal, si P<Significancia, H0 se rechaza, por lo tanto existe una correlacin lineal
y entre el valor est ms alejado, mejor ser esta correlacin.
La determinacin de la mejor ecuacin de regresin lineal mltiple requiere una gran dosis de
juicio, no existe un procedimiento exacto y automtico, sin embargo, para conseguir una buena
ecuacin se deben tomar en cuenta los siguientes putnos:
-Usar el sentido comn para incluir o excluir las variables, esto es importante para no tener
medidas innecesarias o que pueden ser muy difciles de determinar.
- Considerar el valo P, considerar la mejor de las P, ya sea la general o de alguna de las variables,
que se ajuste de mejor manera a la significancia.
-No utilizar todas las variables disponibles, se debe ser selectivo e incluir solo unas cuantas. Estas
deben cuidar que al incluir una variable independiente adicional no incremente el valor de R^2 de
manera sustancial. Para deshacerse de aquellas que no tengan mucha relacin con lo que se desea
obtener, es til determinar el coeficiente de correlacin para cada par de variables que se tomen a
consideracin, para con esto, descartar las que tengan menor.
En conclusin, la regresin lineal mltiple sirve para determinar ciertas medidas que no son fciles
de obtener en base a medidas que realmente lo son, sin embargo, se debe tener mucho cuidado al
momento de seleccionar dichas medidas, as como tomar en cuenta a las medidas R^2 y P, que
son muy tiles para guiar y determinar qu tan bien explica nuestra ecuacin el fenmeno que
queremos analizar, adems de tomar en cuenta que: debe tener sentido numrico, no deber de
haber variables repetidas o redundantes, las variables introducidas en el modelo debern de tener
una cierta justificacin terica o un por qu de estar ah, la relacin entre variables explicativas en
el modelo y casos debe de ser como mnimo de 1 a 10, de lo contrario, como mencionamos
anteriormente R^2 tendera a ser muy grande, la relacin de las variables explicativas con la
variable dependiente debe de ser lineal, es decir, proporcional.
Fuentes consultadas: