Professional Documents
Culture Documents
Estadísticas de la regresión
Coeficiente de
correlación
múltiple 0.99050712
Coeficiente de
determinación
R^2 0.98110436
Inferio
Coeficient Error Estadístic Probabilid Inferio Superi Superio
r
es típico ot ad r 95% or 95% r 95.0%
95.0%
Intercepci
ón -20.45129 11.604 -1.7624 0.22006 -70.37 29.477 -70.37 29.477
Pob 0.006568 0.0033 2.0026 0.18315 -0.007 0.0206 -0.007 0.0206
Pub 0.030104 0.0247 1.2167 0.34783 -0.076 0.1365 -0.076 0.1365
Ingreso 1.545544 0.3195 4.8371 0.04018 0.1707 2.9203 0.170 2.9203
b) Realice una prueba global de hipótesis para determinar si algunos de los coeficientes de
regresión no son iguales a cero.
Hipótesis nula:
Hipótesis alternativa:
F crítico:
F(3, 6-(3+1))= F(3,2)=19.2
F calculado:
𝑆𝑆𝑅/𝑘 𝑀𝑆𝑅
F= 𝑆𝑆𝐸/[𝑛−(𝑘+1)] = 𝑀𝑆𝐸 = 34.61
El F0 es mayor que el valor crítico Fc, por lo tanto, se encuentra en la región de rechazo. Se
descarta la hipótesis nula de que todos los coeficientes de regresión múltiples son cero.
Esto significa que algunas variables independientes (Población metropolitana, Presupuesto
en publicidad, Ingreso familiar medio) tienen la capacidad de explicar la variación de la variable
dependiente (Número de suscriptores).
c) Realice la prueba de los coeficientes individuales. ¿Consideraría eliminar algunos de ellos?
Coef Tc To Ho
±
β1 (Pob) 4.303 2.00 Se acepta
±
β2(Pub) 4.303 1.22 Se acepta
±
β3(Ing) 4.303 4.84 Se rechaza
En las dos primeras pruebas se acepta H0 y se rechaza H1. Se concluye que esos 2 coeficientes
son iguales a 0. Por lo tanto, se debería eliminar las variables independientes población
metropolitana y presupuesto en publicidad.
d) Determine los residuos y trácelos contra los valores ajustados. ¿Hay problemas?
• Los trazos de los residuos muestran una distribución aleatoria de valores positivos y
negativos a lo largo de todo el rango de la variable trazada en el eje horizontal.
• Los puntos están dispersos y no hay un patrón obvio, por lo que no hay razón para dudar de
la suposición de linealidad.
Residuos Frecuencia
0.25 1
0.1 1
0 0
-0.05 1
-0.1 1
0.8
Frecuencia
0.6
0.4
0.2
0
0.25 0.1 0 -0.05 -0.1
Residuos
1 1769 93 42 1 0
2 1740 104 33 1 0
3 1941 104 42 1 1
4 1791 131 56 0 1
5 2001 95 30 1 1
6 1874 98 47 1 0
Resumen
Estadísticas de la regresión
Coeficiente de
correlación
múltiple 0.92345584
Coeficiente de
determinación
R^2 0.85277069
R^2 ajustado 0.26385347
Error típico 88.964346
Observaciones 6
ANÁLISIS DE VARIANZA
Promedio Valor
Grados de Suma de
de los F crítico de
libertad cuadrados
cuadrados F
Regresión 4 45842.6785 11460.6696 1.4480 0.5473
Residuos 1 7914.6549 7914.6549
Total 5 53757.3333
a) Determine la ecuación de regresión; use el salario como variable dependiente y las otras
cuatro variables como independientes.
R^2= 0.85277069. Lo que nos indica es que la variación del salario mensual es
explicado en un 85.28% por la antigüedad, edad, género y puesto.
c) Realice una prueba global de hipótesis para determinar si algunas de las variables
independientes son diferentes de 0.
Hipótesis nula:
Hipótesis alternativa:
F crítico:
F(4, 6-(4+1))= F(4,1)=225
F calculado:
𝑆𝑆𝑅/𝑘 𝑀𝑆𝑅
F= 𝑆𝑆𝐸/[𝑛−(𝑘+1)] = 𝑀𝑆𝐸 = 1.4480
El F0 es menor que el valor crítico Fc, por lo tanto, se encuentra en la región de aceptación.
Se afirma la hipótesis nula de que todos los coeficientes de regresión múltiples son cero.
Esto significa que algunas variables independientes (antigüedad, edad, género y puesto) no
tienen la capacidad de explicar la variación de la variable dependiente (Salario mensual).
d) Realice una prueba individual de hipótesis para determinar si se pueden omitir algunas
variables independientes.
Coef Tc To Ho
Se
β1 (Ant) ±12.706 -0.5291 acepta
Se
β2(Edad) ±12.706 0.4564 acepta
Se
β3(Gén) ±12.706 0.2884 acepta
Se
β4(Puesto) ±12.706 2.2389 acepta
En todas las pruebas se acepta H0 y se rechaza H1. Se concluye que esos coeficientes
son iguales a 0. Por lo tanto, se debería omitir las variables independientes antigüedad,
edad, género y puesto.
e) Determine de nuevo la ecuación de regresión; use sólo las variables independientes que
sean significativas. ¿Cuánto más gana al mes un hombre que una mujer? ¿Hay alguna
diferencia si el empleado ocupa un puesto técnico o uno administrativo?
Y’= 2034.47
Como se concluyó que los coeficientes eran iguales a 0, se determina que no son
significativos para la predicción. Es decir, no hay diferencia de los salarios por
antigüedad, edad, género o puesto.
26. Muchas regiones a lo largo de la costa de Carolina del Norte, de Carolina del Sur y Georgia
experimentaron un rápido crecimiento poblacional durante los últimos 10 años. Se espera que
el desarrollo continúe durante los próximos 10 años. Esto ha motivado a muchas de las
cadenas importantes de abarrotes a construir nuevas tiendas en la región. La cadena Kelly’s
Super Grocery Stores, Inc., no es la excepción, y su director de planeación desea estudiar si es
conveniente agregar más tiendas en esta región. El director considera que hay dos factores
principales que indican la cantidad monetaria que las familias gastan en abarrotes. El primero
es su ingreso y el otro es el número de personas que las integran. El director reunió la
siguiente información muestral.
Estadísticas de la regresión
Coeficiente de
correlación múltiple 0.9331393
Coeficiente de
determinación R^2 0.87074895
R^2 ajustado 0.78458158
Error típico 0.27829342
Observaciones 6
ANÁLISIS DE VARIANZA
Promedio Valor
Grados de Suma de de los crítico
libertad cuadrados cuadrados F de F
Regresión 2 1.5653 0.78263 10.1053 0.0465
Residuos 3 0.2323 0.07745
Total 5 1.7976
Los alimentos y el ingreso se reportan en miles de dólares por año, y la variable tamaño se
refiere al número de personas en el hogar.
ANÁLISIS DE VARIANZA
Promedio
Grados de Suma de de los Valor
libertad cuadrados cuadrados F crítico de F
Regresión 1 49.9135348 49.9135348 0.09053979 0.77848425
Residuos 4 2205.15347 551.288366
Total 5 2255.067
Coeficiente de
determinación R^2 0.02213395
1
𝑉𝐼𝐹 =
1 − (0.02213395)2
𝑉𝐼𝐹 = 1.000490152
Como el VIF es menor que 10, nos indica que la variable independiente ingreso no está muy
correlacionada con la otra variable independiente tamaño.
ANÁLISIS DE VARIANZA
Promedio
Grados de Suma de de los Valor
libertad cuadrados cuadrados F crítico de F
Regresión 1 0.32832022 0.32832022 0.09053979 0.77848425
Residuos 4 14.5050131 3.62625328
Total 5 14.8333333
Coeficiente de
determinación R^2 0.02213395
Ahora calculamos el factor de inflación de la varianza VIF:
1
𝑉𝐼𝐹 =
1 − 𝑅𝑗 2
1
𝑉𝐼𝐹 =
1 − (0.02213395)2
𝑉𝐼𝐹 = 1.000490152
Como el VIF es menor que 10, nos indica que la variable independiente tamaño no está muy
correlacionada con la otra variable independiente ingreso.
b) Determine la ecuación de regresión. Haga un comentario sobre la ecuación de regresión.
¿Cuánto dinero agrega un miembro familiar adicional a la cantidad que se gasta en alimentos?
Por cada miembro familiar adicional, el gasto en alimentos aumenta en 0.2604 soles.
c) ¿Cuál es el valor de R2? ¿Se puede concluir que este valor es mayor que 0?
R^2 0.87075, lo cual significa que la variación de los gastos en alimentos es explicado por el
ingreso y tamaño de familiares en un 87.08%
Hipótesis nula:
Hipótesis alternativa:
F crítico:
F(2, 6-(2+1))= F(2,3)= 9.55
F calculado:
𝑆𝑆𝑅/𝑘 𝑀𝑆𝑅
F= = = 10.1053
𝑆𝑆𝐸/[𝑛−(𝑘+1)] 𝑀𝑆𝐸
El F0 es mayor que el valor crítico Fc, por lo tanto, se encuentra en la región de rechazo. Se
descarta la hipótesis nula de que todos los coeficientes de regresión múltiples son cero.
Esto significa que algunas variables independientes (ingreso, tamaño) tienen la capacidad
de explicar la variación de la variable dependiente (gasto en alimentos).
Ingreso Tamaño
En todas las pruebas se rechaza H0 y se acepta H1. Se concluye que esos coeficientes
son diferentes a 0. Por lo tanto, las variables independientes ingreso y tamaño son
significativas para la predicción.
e) Trace los residuos en un histograma. ¿Hay algún problema con la suposición de normalidad?
Residuos Frecuencia
0.3 0
0.2 1
0 1
-0.2 1
-0.3 0
0.8
Axis Title
0.6
0.4
0.2
0
0.3 0.2 0 -0.2 -0.3
Axis Title
0.3
0.2
0.1
0
0 1 2 3 4 5 6
-0.1
-0.2
-0.3