You are on page 1of 138

MANUAL DE PRCTICAS

CHI CUADRADO EN SPSS


UNIVERSIDAD NACIONAL AGRARIA DE LA SELVA
FACULTAD DE CIENCIAS ECONMICAS Y ADMINISTRATIVAS
DEPARTAMENTO ACADMICO DE CIENCIAS ECONMICAS
LA PRUEBA DE CHI-CUADRADO
PRUEBA DE BONDAD DE AJUSTE
Si:
5 <
ei
f
Agrupar dicha frecuencia con las frecuencias adyacentes,
hasta que:
5 >
ei
f
De igual manera se agrupan las frecuencias observadas.
Al agrupar las frecuencias esperadas y observadas, el
nmero de categoras ( ) se reduce.
k
( )
2
0 2
1
K
k ek
c
k
ek
f f
X
f
=

CHI-CUADRADO CALCULADO ( )
2
c
X
GRADO DE LIBERTAD ( ) gl
1 gl K m =
2
;o gl
X
CHI-CUADRADO CRTICA ( )
2
;o gl
X
Categoras
Parametros estimados en la distribucin de probabilidad
K N
m N
=
=
EJEMPLO 1
(Distribucin Uniforme)
Un distribuidor regional de sistemas de aire acondicionado ha subdividido su regin en cuatro
territorios. A un posible comprador de una distribuidora se le dice que las instalaciones de
equipos se distribuyen de manera aproximamente igual en los cuatro territorios. El prospecto
de comprador toma una muestra aleatoria de 40 instalaciones colocadas el ao anterior, de
los archivos de la compaa, y encuentra que el nmero de instalaciones en cada uno de los
cuatro territorios son los que se enlistan en la fila de frecuencias observadas de la tabla.
Pruebe la hiptesis nula de que las instalaciones estn distribuidas en forma uniforme en los
cuatro territorios, utilizando un nivel de significancia del 5%.
Numeric (numrico) para los datos de instalaciones
Numeric (numrico) para las categoras Territorios
Insertar los nombres para los datos de instalaciones y para el factor (categorias)
Hacer Click en Data View para pegar los datos de ventas y del factor (tratamientos)
3
1
2
Seleccionar la lista de datos de instalacin y hacer un click en insertar
1
Hacer Click en OK
2
Seleccionar la lista de la variable categorica y hacer un click en insertar
1
Hacer Click en OK
3
2
Seleccionar todas las categoras uniformes
2
4
c
X =
CHI-CUADRADO CALCULADO ( )
2
c
X
GRADO DE LIBERTAD ( ) gl
3 1 0 4 = = gl
81 . 7
2
05 . 0 ; 3
= X
CHI-CUADRADO CRTICA ( )
2
;o gl
X
4
0
K
m
=
=
( )
2
0 2
1
K
k ek
c
k
ek
f f
f
=

X =

1) HIPOTESIS
H
0
: El nmero de instalaciones estn distribuidas de manera uniforme en los
cuatro territorios.
H
a
: El nmero de instalaciones no estn distribuidas de manera uniforme en los
cuatro territorios.
2) NIVEL DE SIGNIFICANCIA (o)


3) PUNTOS CRITICOS









4) CHI-CUADRADO CALCULADO


5) CONCLUSIONES
Como ( ), entonces se acepta la H
0
, es decir, el nmero de
instalaciones estn distribuidas de manera uniforme en los cuatro territorios, a un
nivel de confianza del 95%
05 . 0 = o
81 . 7
2
05 . 0 ; 3
= X
0.95 0.95
0.05
Se
acepta
H
a
Se
acepta
H
0
4
2
=
c
X
2
05 . 0 ; 3
2
X X
c
<
81 . 7 4 <
EJEMPLO 2
(Distribucin Poisson)
Suponga que se plantea la hiptesis de que la distribucin de descomposturas de maquinaria
por hora en una planta de ensamble se ajusta a una distribucin poisson. En la tabla se
presenta el nmero de descomposturas observadas durante 40 horas que se incluyeron en la
muestra. Pruebe la hiptesis a un nivel de significancia del 1%.
hora por uras descompost 2 . 3
40
128
0
0
= = = =

i
i i
f
f X
X
1 = m
| |
!
/
x
e
x X P
x

= =
1
2
3
6.8
6
8.8 8
Numeric (numrico) para las categoras
Numeric (numrico) para los datos de ifrecuencia observadas
Insertar los nombres para los datos de frecuencias observadas y para el factor (categorias)
Hacer Click en Data View para pegar los datos de frecuencias observadas y para el factor (categorias)
3
1
2
Seleccionar la lista de datos de ifrecuencias observadas y hacer un click en insertar
1
Hacer Click en OK
2
Seleccionar la lista de la variable categorica y hacer un click en insertar
1
2
Seleccionar Values e insertar cada una delas observaciones halladas,
teniendo cuidado del orden en que se insertan
Hacer Click en OK
2
0.67
c
X =
CHI-CUADRADO CALCULADO ( )
2
c
X
GRADO DE LIBERTAD ( ) gl
3 1 1 5 = = gl
34 . 11
2
01 . 0 ; 3
= X
CHI-CUADRADO CRTICA ( )
2
;o gl
X
5
1
K
m
=
=
( )
2
0 2
1
K
k ek
c
k
ek
f f
f
=

X =

1) HIPOTESIS
H
0
: La distribucin de las descomposturas observadas en la maquinaria cada hora
se ajusta a una variable con distribucin Poisson.
H
a
: La distribucin de las descomposturas observadas en la maquinaria cada hora
no se ajusta a una variable con distribucin Poisson.
2) NIVEL DE SIGNIFICANCIA (o)


3) PUNTOS CRITICOS









4) CHI-CUADRADO CALCULADO


5) CONCLUSIONES
Como ( ), entonces se acepta la H
0
, es decir, La
distribucin de las descomposturas observadas en la maquinaria cada hora se
ajusta a una variable con distribucin Poisson, a un nivel de confianza del 99%
01 . 0 = o
67 . 0
2
=
c
X
2
01 . 0 ; 3
2
X X
c
<
34 . 11 67 . 0 <
34 . 11
2
01 . 0 ; 3
= X
0.99 0.99
0.01
Se
acepta
H
a
Se
acepta
H
0
EJEMPLO 3
(Distribucin Binomial)
Si un ingeniero de control de calidad toma una muestra de 10 neumticos que salen de una
lnea de ensamblaje y l desea verificar sobre la base de los datos que siguen, los nmeros
de llantas con defectos observadas en 200 das, si es cierto que el 5% de todos los
neumticos tienen defecto; es decir, si el muestrea una poblacin binomial con n = 10 y
p=0.05. Pruebe la hiptesis nula de que el nmero de defectos de las llantas se ajustan a una
distribucin binomial, con un nivel de significancia del 5%.
| |
( )
x n x
q p
x n x
n
x X P

= =
! !
!
/ |
1
2
3
17.2
Numeric (numrico) para las categoras
Numeric (numrico) para los datos de ifrecuencia observadas
Insertar los nombres para los datos de frecuencias observadas y para el factor (categorias)
Hacer Click en Data View para pegar los datos de frecuencias observadas y para el factor (categorias)
3
1
2
Seleccionar la lista de datos de ifrecuencias observadas y hacer un click en insertar
1
Hacer Click en OK
2
Seleccionar la lista de la variable categorica y hacer un click en insertar
1
2
Seleccionar Values e insertar cada una delas observaciones halladas,
teniendo cuidado del orden en que se insertan
Hacer Click en OK
2
8.29
c
X =
CHI-CUADRADO CALCULADO ( )
2
c
X
GRADO DE LIBERTAD ( ) gl
2 1 0 3 = = gl
99 . 5
2
05 . 0 ; 2
= X
CHI-CUADRADO CRTICA ( )
2
;o gl
X
3
0
K
m
=
=
( )
2
0 2
1
K
k ek
c
k
ek
f f
f
=

X =

1) HIPOTESIS
H
0
: El nmero de defectos de las llantas se ajustan a una distribucin binomial.
H
a
: El nmero de defectos de las llantas no se ajustan a una distribucin binomial.
2) NIVEL DE SIGNIFICANCIA (o)


3) PUNTOS CRITICOS









4) CHI-CUADRADO CALCULADO


5) CONCLUSIONES
Como ( ), entonces se acepta la H
a
, es decir, el nmero de
defectos de las llantas no se ajustan a una distribucin binomial, a un nivel de
significancia del 5%
05 . 0 = o
2
8.29
c
X =
2
05 . 0 ; 2
2
X X
c
>
8.29 5.99 >
99 . 5
2
05 . 0 ; 2
= X
0.95 0.95
0.05
Se
acepta
H
a
Se
acepta
H
0
EJEMPLO 4
(Distribucin Normal)
Pruebe la hiptesis de que la distribucin de frecuencia de las duraciones de bateras (en
horas) dadas en la siguiente tabla, se puede aproximar mediante una distribucin normal.
Utilice un nivel de significancia del 5%
0
0
136.5
3.4
40
k k
k
X f
X
f
= = =

( )
( )
2
2
0
2
0
0
0
136.5
484.75
40
0.7
1 40 1
k k
i i
k
k
X f
X f
f
S
f


= = =

2 = m
( ) | | o ; / ~ s N x X P
( )
/ 0; 1 P Z z N o s ~ = = (

i
i
X
z

o

=
1
2
3
10.4
8.7
5
8
Numeric (numrico) para las categoras
Numeric (numrico) para los datos de ifrecuencia observadas
Insertar los nombres para los datos de frecuencias observadas y para el factor (categorias)
Hacer Click en Data View para pegar los datos de frecuencias observadas y para el factor (categorias)
3
1
2
Seleccionar la lista de datos de ifrecuencias observadas y hacer un click en insertar
1
Hacer Click en OK
2
Seleccionar la lista de la variable categorica y hacer un click en insertar
1
2
Seleccionar Values e insertar cada una delas observaciones halladas,
teniendo cuidado del orden en que se insertan
Hacer Click en OK
2
2.9
c
X =
CHI-CUADRADO CALCULADO ( )
2
c
X
GRADO DE LIBERTAD ( ) gl
1 1 2 4 = = gl
84 . 3
2
05 . 0 ; 1
= X
CHI-CUADRADO CRTICA ( )
2
;o gl
X
4
2
K
m
=
=
( )
2
0 2
1
K
k ek
c
k
ek
f f
f
=

X =

1) HIPOTESIS
H
0
: La duracin de las bateras se ajustan a una distribucin normal.
H
a
: La duracin de las bateras no se ajustan a una distribucin normal.
2) NIVEL DE SIGNIFICANCIA (o)


3) PUNTOS CRITICOS









4) CHI-CUADRADO CALCULADO


5) CONCLUSIONES
Como ( ), entonces se acepta la H
0
, es decir, La duracin
de las bateras se ajustan a una distribucin normal, a un nivel de confianza del
95%
05 . 0 = o
9 . 2
2
=
c
X
2
05 . 0 ; 2
2
X X
c
<
84 . 3 9 . 2 <
84 . 3
2
05 . 0 ; 1
= X
0.95 0.95
0.05
Se
acepta
H
a
Se
acepta
H
0
EJEMPLO 5
(Distribucin Exponencial)
Pruebe la hiptesis de que la distribucin de frecuencia de llegada de las solicitudes de
reparacin de maquinaria, las cuales estn dadas en la siguiente tabla, se puede aproximar
mediante una distribucin exponencial. Utilice un nivel de significancia del 5%
0
0
2, 540
36.3
70
k k
k
X f
X
f
= = = =

1 = m
| |
1
/ 1 P X x e

s =
1
2
3
Numeric (numrico) para las categoras
Numeric (numrico) para los datos de ifrecuencia observadas
Insertar los nombres para los datos de frecuencias observadas y para el factor (categorias)
Hacer Click en Data View para pegar los datos de frecuencias observadas y para el factor (categorias)
3
1
2
Seleccionar la lista de datos de ifrecuencias observadas y hacer un click en insertar
1
Hacer Click en OK
2
Seleccionar la lista de la variable categorica y hacer un click en insertar
1
2
Seleccionar Values e insertar cada una delas observaciones halladas,
teniendo cuidado del orden en que se insertan
Hacer Click en OK
2
21.11
c
X =
CHI-CUADRADO CALCULADO ( )
2
c
X
GRADO DE LIBERTAD ( ) gl
4 1 1 6 = = gl
49 . 9
2
05 . 0 ; 4
= X
CHI-CUADRADO CRTICA ( )
2
;o gl
X
6
1
K
m
=
=
( )
2
0 2
1
K
k ek
c
k
ek
f f
f
=

X =

1) HIPOTESIS
H
0
: El orden de llegadas de solicitudes de reparacin se ajustan a una distribucin
Exponencial.
H
a
: El orden de llegadas de solicitudes de reparacin no se ajustan a una
distribucin Exponencial.
2) NIVEL DE SIGNIFICANCIA (o)


3) PUNTOS CRITICOS









4) CHI-CUADRADO CALCULADO


5) CONCLUSIONES
Como ( ), entonces se acepta la H
a
, es decir, El orden de
llegadas de solicitudes de reparacin no se ajustan a una distribucin
Exponencial, a un nivel de significancia del 5%
05 . 0 = o
11 . 21
2
=
c
X
2
05 . 0 ; 2
2
X X
c
>
29 . 9 11 . 21 >
29 . 9
2
05 . 0 ; 6
= X
0.95 0.95
0.05
Se
acepta
H
a
Se
acepta
H
0
PRUEBA PARA LA
INDEPENDENCIA DE DOS
VARIABLES
(TABLAS DE CONTIGENCIA)
( )
2
0 2
1 1
R K
rk erk
c
r k
erk
f f
X
f
= =

CHI-CUADRADO CALCULADO ( )
2
c
X
GRADO DE LIBERTAD ( ) gl
( )( )
1 1 gl R K =
2
;o gl
X
CHI-CUADRADO CRTICA ( )
2
;o gl
X
Categoras de la Variable Categorica 1
Categoras de la Variable Categorica 2
K N
R N
=
=
FRECUENCIA ESPERADA ( )
e
f
0
rK Rk
jk
f f
f
n
=
EJEMPLO 1
El director de una escuela primaria divide a los padres de familia en tres categoras de
ingresos, de acuerdo con el rumbo en donde viven y de acuerdo con tres niveles de
participacin en los programas escolares. Con los datos de la tabla pruebe la hiptesis de que
no existe relacin entre los ingresos y la participacin de los programas escolares, utilizando
un nivel de significancia del 5%.
Numeric (numrico) para los datos de frecuencia observadas
Insertar los nombres para los datos de frecuencias observadas y para los factores (categoras)
Hacer Click en Data View para pegar los datos de frecuencias observadas y para los factores (categoras)
3
1
2
Numeric (numrico) para la categora 1
Numeric (numrico) para la categora 2
Seleccionar la lista de datos de ifrecuencias observadas y hacer un click en insertar
1
Hacer Click en OK
2
Seleccionar la lista de la variable categrica 1 y hacer un click en insertar
1
2
Seleccionar la lista de la variable categrica 2 y hacer un click en insertar
3
Seleccionar Stadistic
Hacer Click en Continue
2
1
Seleccionar Chi-Square
Hacer Click en OK
2
16 . 17
2
=
c
X
CHI-CUADRADO CALCULADO ( )
2
c
X
GRADO DE LIBERTAD ( ) gl
( )( ) 4 1 3 1 3 = = gl
49 . 9
2
05 . 0 ; 4
= X
CHI-CUADRADO CRTICA ( )
2
;o gl
X
3
3
=
=
r
k
1) HIPOTESIS
H
0
: El nivel Econmico de los padres de familias y la Participacin a los
Programas son independientes (no existe relacin).
H
a
: El nivel Econmico de los padres de familias y la Participacin a los
Programas son dependientes (existe relacin).
2) NIVEL DE SIGNIFICANCIA (o)


3) PUNTOS CRITICOS









4) CHI-CUADRADO CALCULADO


5) CONCLUSIONES
Como ( ), entonces se acepta la H
a
, es decir, El nivel
Econmico de los padres de familias y la Participacin a los Programas son
dependientes , a un nivel de significancia del 5%
05 . 0 = o
16 . 17
2
=
c
X
2
05 . 0 ; 2
2
X X
c
>
29 . 9 16 . 17 >
29 . 9
2
05 . 0 ; 6
= X
0.95 0.95
0.05
Se
acepta
H
a
Se
acepta
H
0
MEDIDAS DE ASOCIACIN ENTRE
LAS VARIABLES CATEGORICAS
Numeric (numrico) para los datos de frecuencia observadas
Insertar los nombres para los datos de frecuencias observadas y para los factores (categoras)
Hacer Click en Data View para pegar los datos de frecuencias observadas y para los factores (categoras)
3
1
2
Numeric (numrico) para la categora 1
Numeric (numrico) para la categora 2
Seleccionar la lista de datos de ifrecuencias observadas y hacer un click en insertar
1
Hacer Click en OK
2
Seleccionar la lista de la variable categrica 1 y hacer un click en insertar
1
2
Seleccionar la lista de la variable categrica 2 y hacer un click en insertar
3
Seleccionar Stadistic
Hacer Click en Continue
3
1
Seleccionar Chi-Square
2
Seleccionar Contigency Coefifent
y Phi and Cramers V
Hacer Click en OK
2
EL COEFICIENTE DE CONTINGENCIA ( )
C
2
2
c
c
X
C
n X
=
+
{ }
{ }
min 1, 1
0
1 min 1, 1
R K
C
R K

s s
+
donde R representa el nmero de filas y K el nmero de columnas.
C 0.30, significa que el grado de asociacin entre las variables no es muy
buena.
C > 0.30, indica un buen grado de asociacin entre las variables.
EJEMPLO:
2
17.16
c
X =
1
0
1 1
C s s
+
Utilizando los datos de Prueba de Independencia de dos variables categricas:
17.16
0.2375
287 17.16
C = =
+
287 n =
3 R =
3 K =
0 0.7071 C s s
El punto medio del intervalo [0, 0.7071] es 0.3536
Como el coeficiente de contingencia es inferior a 0.30 el grado de asociacin no es
adecuada.
EL COEFICIENTE DE PHI ( )
|
2
c
X
n
| =
0 1 C s s
donde R representa el nmero de filas y K el nmero de columnas.
C 0.30, significa que el grado de asociacin entre las variables no es muy
buena.
C > 0.30, indica un buen grado de asociacin entre las variables.
EJEMPLO:
2
17.16
c
X =
0 1 C s s
Utilizando los datos de Prueba de Independencia de dos variables categricas:
17.16
0.2445
287
| = =
287 n =
3 R =
3 K =
El punto medio del intervalo [0, 1] es 0.50
Como el coeficiente de contingencia es inferior a 0.30 el grado de asociacin no es
adecuada.
EL COEFICIENTE DE CRAMER ( ) V
2
c
X
V
nt
=
0 1 C s s
donde t es el menor de los nmeros (R-1) y (K-1); R representa el nmero de filas
y K el nmero de columnas.
C 0.30, significa que el grado de asociacin entre las variables no es muy
buena.
C > 0.30, indica un buen grado de asociacin entre las variables.
EJEMPLO:
2
16.17
c
X =
0 1 C s s
Utilizando los datos de Prueba de Independencia de dos variables categricas:
( )( )
17.16
0.1729
287 2
V = =
287 n =
3 R =
3 K =
El punto medio del intervalo [0, 0.1] es 0.50
Como el coeficiente de contingencia es inferior a 0.30 el grado de asociacin no es
adecuada.
2 t =

You might also like