You are on page 1of 83

El estadstico Chi-

cuadrado y contrastes
asociados ING. RAL ALVAREZ GUALE, MPC
Estimacin de Intervalos y
Prueba de Hiptesis para
Varianzas Poblaciones

ING. RAL ALVAREZ GUALE, MPC


Estimacin y prueba de hiptesis de dos medias o
proporciones poblacionales

Anlisis del valor de una varianza poblacional o de la


relacin entre dos varianzas poblacionales
Ejemplos
Conocer el volumen promedio que una mquina llena las botellas
de soda puede no ser suficiente para el gerente de produccin.
La variabilidad del contenido puede ser tambin de alta
importancia:
Una alta variabilidad implicar un alto nmero de botellas con bajo
contenido, las cuales producen molestias y reclamos de los clientes; as
como un alto nmero de botellas con exceso de soda, en perjuicio de la
empresa.
Se requiere controlar tanto la media como la variabilidad del
volumen de llenado de las botellas.

Un gerente puede requerir conocer si hay diferencias en la


variabilidad de las ventas entre dos reas geogrficas distintas.

Se puede requerir saber si un proceso genera una produccin de


mayor variabilidad que otro.
Se presentarn mtodos que pueden ser usados para
efectuar inferencias respecto de una o dos varianzas
poblacionales.

Se presentarn dos nuevas distribuciones:


Chi-cuadrado
F
Objetivos

Formular y probar hiptesis para una varianza


poblacional
Hallar el(los) valor(es) crtico(s) chi-cuadrado(s)
de la tabla Chi-cuadrado
Prueba de Hiptesis para
Varianzas

Prueba de Hiptesis
para Varianzas

Prueba para Una Prueba para Dos


Varianza Poblacional Varianzas Poblacionales

Estadstico de prueba
Estadstico de prueba F
Chi-cuadrado
Caso de una Varianza
Poblacional
Los casos que involucran una varianza
poblacional emplean uno de dos procedimientos
estadsticos:
Prueba de hiptesis
Estimados de intervalos de confianza
El gerente de un banco puede creer que la
varianza poblacional del tiempo de servicio al
cliente es no mayor a 36 minutos al cuadrado.
Se plantea la hiptesis nula que la varianza es
mayor o igual a 36 min2 y, en base a data
muestral, se debe estar en capacidad de
rechazar o no la hiptesis nula.
Caso de una Varianza
Poblacional
Un gerente requiere tomar una muestra de los
clientes del restaurante para determinar el
nmero de veces al mes que cenan fuera de
casa. Para esto requiere determinar el tamao
de la muestra, lo cual depende de la varianza
poblacional. Puede tomar una muestra piloto y
construir un intervalo de confianza para la
estimacin de la varianza poblacional.
Lo ideal seran pruebas sobre la desviacin estndar, sin
embargo no se disponen de las mismas, se debe recurrir a
pruebas sobre la varianza para a partir de las mismas
inferir sobre la desviacin estndar.

Interrogantes como 2 36? Pueden analizarse a travs


de pruebas de hiptesis con los procedimientos llamados
Pruebas Chi-cuadrado.

Cuando una muestra aleatoria proviene de una


poblacin distribuida normalmente, la distribucin
de la varianza muestral estandarizada es una
distribucin chi-cuadrado.
Distribucin Chi-cuadrada

Una variable continua X tiene una


distribucin chi cuadrada, con v grados
de libertad, si su funcin de densidad
es dada por
Teorema

S2 es la varianza de una muestra aleatoria de


Si
tamao n que se toma de una poblacin normal que
tiene la varianza , entonces el estadstico
Prueba de Hiptesis para Una Varianza:
Estadstico de Prueba Chi-cuadrado

El estadstico de prueba chi-cuadrado para una varianza poblacional


como se mencion es:

(n 1)s 2
2
2

Donde
2 = Variable chi-cuadrada estandarizada
n = Tamao de muestra
s2 = Varianza muestral
El estadstico de prueba estandariza
2 = Varianza (supuesto) la varianza muestral (similar a los
estadsticos z y t de los captulos
anteriores)
Grfico de la Distribucin
Chi Cuadrado
Hallando el Valor Crtico
El valor crtico, , puede obtenerse de la Tabla Chi-cuadrado
2

Prueba Unilateral
Derecha:
H0: 2 02
HA: 2 > 02

0 2
No rechazar H0 Rechazar H0
2

Distribucin Chi-cuadrado
La distribucin chi-cuadrado es una familia de distribuciones, que
depende de los grados de libertad:

g.l. = n 1

Supuesto: La poblacin es normal

0 4 8 12 16 20 24 28 2 0 4 8 12 16 20 24 28 2 0 4 8 12 16 20 24 28 2

g.l. = 1 g.l. = 5 g.l. = 15


Problemas para obtener

Obtener
el valor de con un nivel de significancia del 5% de
una cola a la derecha y n =14

v=14-1=13
Obtener el valor de con un nivel de significancia del 5% de
una cola a la izquierda y n =14

v=14-1=13
Obtener el valor de con un nivel de significancia del 5% de
dos colas y n =14

v=14-1=13
Problemas para obtener

Obtener el valor de con un nivel de significancia del


1% de una cola a la derecha y v =7

Obtener el valor de con un nivel de significancia del


5% de una cola a la izquierda y n =17

v=17-1=16
Obtener el valor de con un nivel de significancia del
10% de dos colas y v =27
Teorema

Si S2 es la varianza de una muestra aleatoria de


tamao n, se puede escribir:
Prueba de Hiptesis de Una
Varianza, Chi-cuadrado

1. Formular las hiptesis en trminos de 2


2. Fijar el nivel de significancia
3. Construir la regin de rechazo
4. Calcular el estadstico de prueba,
5. Tomar una decisin
6. Interpretar los resultados
Hiptesis concernientes a
una varianza
Regiones crticas para
probar (poblacin normal)
Hiptesis Rechazar la
Hiptesis Rechazar la
alternativa hiptesis nula
alternativa hiptesis nula
si:
si:

O bien
Ejemplo: Solucin
Hiptesis: H0: 2 16, HA: 2 > 16
Regin de rechazo: Usar la tabla Chi-cuadrado para hallar el valor crtico:
2 = 24.9958 ( = 0.05 y 161=15 g.l.)

2 = 24.9958
= 0.05
0 2
No rechazar H0 Rechazar H0
Estadstico de prueba:
(n 1)s 2 (16 1)24

2
2
22.5
16
Decisin: Como = 22.5 < 24.9958 =
2 2
, no rechazamos H0

Conclusin: No hay evidencia significativa al nivel = 0.05 para concluir


que la varianza excede a 16 grados2.
Prueba de Hiptesis de Una Varianza, Chi-cuadrado:
Unilateral y Bilateral

Prueba Unilateral Izquierda: Prueba Bilateral:


H0: 2 02 H0: 2 = 02
HA: 2 < 02 HA: 2 02

/2
/2

0 2 0 2
Rechazar No rechazar H0 Rechazar No rechazar Rechazar H0
H0 H0 H0
21- 21-/2 2/2
( 2L) ( 2U)
Ejemplo
Una congeladora comercial debe mantener la
temperatura seleccionada con poca variacin.
Las especificaciones indican que la desviacin
estndar no debe ser mayor a 4 grados (o la
varianza a 16 grados2).
Una muestra de 16 datos
es evaluada y da una varian-
za muestral de s2 = 24. Evale
si la desviacin estndar espe-
cificada ha sido excedida. Use
= 0.05.
Problema 1
Un fabricante de bateras para automvil garantiza que su
producto durar, en promedio 3 aos con una desviacin
estndar de 1 ao. Si cinco de estas bateras tienen
duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2, el fabricante
continuar convencido de que sus bateras tienen una
desviacin estndar de 1 ao? Suponga que las
duraciones de las bateras tienen una distribucin normal.
Solucin
Datos:
Solucin: Problema 1
Se declaran las hiptesis
Ho: =1
H1: 1
Se determinan los estadsticos-comprobacin
Solucin: Problema 1
Con un nivel de significancia del 5%: No existe
evidencia de que la duracin de las bateras no sea
de un ao
Problema 2
El proceso de bruido (que se utiliza para desbastar
ciertas obleas de silicio al grosos adecuado) es
aceptable solo si , la desviacin estndar poblacional
del grosor del cubo cortado de las obleas, es cuando
mucho 0.50 mil. Use el nivel de significancia de 0.05
para probar la hiptesis nula =0.50 contra la hiptesis
alternativa >0.50, si el grosor de 15 cubos cortados de
tales obleas tienen una desviacin estndar de 0.64
mil.
Solucin
Datos:
Solucin: problema 2
Se declaran las hiptesis

Ho: =0.50
H1: >0.5
Se determinan los lmites de confianza
Se rechaza la hiptesis nula si X2>23.685 para un para
14 grados de libertad
Solucin: problema 2
Solucin: problema 2
Se determinan los estadsticos-comprobacin

Se toma la decisin Se acepta Ho


Solucin Problema 2
Al 10% de nivel de significancia, se rechaza Ho
Hiptesis respecto a varias
proporciones
Cuando se compara la respuesta del
consumidor (porcentaje favorable y
porcentaje desfavorable) a dos productos
diferentes, cuando se decide si la proporcin
de defectuosos de un proceso dado
permanece constante de un da a otro,
cuando se juzga si hay diferencia en
persuasin poltica entre varios grupos de
nacionalidad y muchas situaciones similares,
se est probando si dos o ms poblaciones
binomiales tienen el mismo parmetro p. DE
hecho se est interesado probar la hiptesis
nula:
Tabla de varias
proporciones
Muestra Muestra Muestra Total
1 2 Muestr
Muestr k
Muestr Total
xitos a1 a2 ak

Fracasos xitos

Total Fracaso
s
Total
Problema 3:
Muestrasde tres tipos de materiales,
sometidos a cambios extremos de
temperatura, dieron los resultados que se
presentan en la siguiente tabla:

Materia Mater Material Total


lA ial B C
Desmonoram
iento
Permanece
Intacto
Total
Total
Solucin Problema 3:
Se plantean las hiptesis

Establecer los lmites de confianza


Rechazar la hiptesis nula
Si
Se determinan los nmero esperados de xito y fracasos
Se determina el estadstico

Se toma una decisin: dados que =4.575 no supera


5.991, la hiptesis nula no puede rechazarce.
Forma resumida de Clculos

Materi Mater Materi Total


al A ial B al C
Desmonoramiento
Tabla
Permanece Intacto Real

Total

Material Materi Materi Total


A al B al C
Tabla
Desmonoramiento Esperada
Permanece Intacto

Total
Suma total
Problema 4:
Estn en desarrollo cuatro mtodos para fabricar
discos de un material superconductor. Se elaboran
cincuenta discos con cada mtodo y se comprueba su
superconductividad cuando se enfran con nitrgeno
lquido:
Mto Mtod Mtod Mto Total
do 1 o2 o3 do 4
Supercond
uctores
Fallas

Total

Realice una prueba chi cuadrada con un nivel de


significancia del 5%. Si hay diferencia significativa entre
las proporciones de los superconductores fabricados,
grafique los intervalos de confianza.
Solucin Problema 4:
Se plantean las hiptesis

Establecer los lmites de confianza


Rechazar la hiptesis nula
Si
Se determinan los nmero esperados de xito y
fracasos
Se determina el estadstico

Se toma una decisin: dados que =4.575 no supera


5.991, la hiptesis nula no puede rechazarce.
Forma resumida de Clculos

Materia Materia Materia Total


lA lB lC
Desmonoramiento
Tabla
Permanece Intacto Real

Total

Materia Materi Materi Total


lA al B al C
Tabla
Desmonoramiento Esperada
Permanece Intacto

Total
Suma total
Estimacin del Intervalo de Confianza para
una Varianza Poblacional
Intervalo de Confianza para 2

El intervalo de confianza para 2 es:

/2
/2

21-/2 2/2 2
( 2L) ( 2U)
(n 1)s 2 (n 1)s 2
Donde 2L y 2U pertenecen a la
2
2

distribucin 2 con n -1 grados de U L2
libertad
Intervalo de Confianza: Ejemplo

Una muestra de 16 datos de una congeladora da una


varianza muestral de s2 = 24.
Formar un intervalo de confianza al 95% para la varianza
poblacional.
Intervalo de Confianza: Ejemplo
(Solucin)
Usar la tabla chi-cuadrado para hallar 2L y 2U:
( = 0.05 y 16 1 = 15 g.l.)

/2=0.025 /2=0.025

20.975 20.025
( 2L) 6.2621 27.4884 ( 2U)
(n 1)s 2 (n 1)s 2 (16 1)24 (16 1)24

2
2 13.096 2 57.489
U2 L2 27.4884 6.2621

Estamos 95% seguros que la varianza poblacional est entre 13.096 y


57.489 grados2. (Tomando la raz cuadrada, estamos 95% seguros que la
desviacin estndar poblacional est entre 3.619 y 7.582 degrees).
Prueba de Bondad de Ajuste y
Anlisis de Contingencia
Bondad de Ajuste
Distintos procedimientos estadsticos
requieren que la data muestral provengan
de poblaciones normalmente distribuidas.
Cuando se emplea la distribucin t en
la estimacin de intervalos de
confianza o en pruebas de hiptesis
sobre una o dos medias poblacionales,
las poblaciones de inters se asumen
normalmente distribuidas.
En distintos procedimientos ANOVA se
asumen poblaciones normalmente
distribuidas.
Bondad de Ajuste
Cmo se puede verificar que estos supuestos son
satisfechos?

En diversas situaciones se requiere conocer si la


data muestral proviene o no de una determinada
distribucin probabilstica.

Cmo proceder?
Bondad de Ajuste

La prueba de bondad de ajuste Chi-cuadrado es una


prueba estadstica que permite determinar si una
data muestral proviene o no de una hipottica
distribucin.
Objetivos

Usar la prueba chi-cuadrado de bondad de


ajuste para determinar si los datos se
ajustan a una distribucin especfica.

Desarrollar una tabla de anlisis


contingencia y evaluar la independencia a
travs de la prueba chi-cuadrado.
Prueba Chi-cuadrado de Bondad
de Ajuste
Los datos de la muestra son coherentes
con una distribucin supuesta?

Ejemplos:
Las llamadas al soporte tcnico tienden a
ser iguales todos los das de la semana?
(Las llamadas siguen una distribucin
uniforme?)
Las medidas en un proceso de produccin
siguen una distribucin normal?
Prueba Chi-cuadrado de Bondad
de Ajuste (continuacin)
Las llamadas al soporte tcnico tienden a ser
iguales todos los das de la semana? (Es decir: Las
llamadas siguen una distribucin uniforme?).
Para cada da de la semana se tom una muestra de
10 das:
Total de llamadas (muestra):
Lunes 290
Martes 250
Miercoles 238
Jueves 257
Viernes 265
Sbado 230 Total = 1722
Domingo 192
Lgica de la Prueba Chi-cuadrado
de Bondad de Ajuste
Si las llamadas estuvieran uniformemente dis-
tribuidas, se esperara que las 1,722 llamadas se
distribuyan equitativamente en los 7 das:

1,722
246 llamadas esperadas por da
7
Prueba chi-cuadrado de bondad de ajuste: Evala
si los resultados muestrales son consistentes con
los resultados esperados.
(Es decir, datos observados = datos esperados)
Frecuencias Observadas vs.
Esperadas
Observado Esperado
oi ei
Lunes 290 246
Martes 250 246
Miercoles 238 246
Jueves 257 246
Viernes 265 246
Sbado 230 246
Domingo 192 246

Total 1,722 1,722


Estadstico de prueba chi-
cuadrado
H0: La distribucin de llamadas es uniforme respecto
a los das de la semana (observado = esperado)
HA: La distribucin de llamadas no es uniforme

El estadstico de prueba es:

(o i e i ) 2

2
(gl k 1)
ei
Donde:
k = Nmero de categoras
oi = Frecuencia observada en la categora i
ei = Frecuencia esperada en la categora i
(
2 i

Rechazar H0
si
o
ei
e

22
Regin de Rechazo
H0: La distribucin de llamadas es uniforme
respecto a los das de la semana
HA: La distribucin de llamadas no es uniforme

) 2

0
No rechazar H0
2

Rechazar H0
2

(con k-1 grados de libertad)


Estadstico de Prueba Chi-
Cuadrado
H0: La distribucin de llamadas es uniforme respecto a los das de la semana
HA: La distribucin de llamadas no es uniforme

20.05 = 12.5916 (gl = k 1 = 6)

= 0.05

0 No rechazar H0 Rechazar H0
2
Estadstico de prueba:
(290 246)2 (250 246)2 (192 246)2

2
... 23.05
246 246 246

Decisin: Como 2 = 23.05 > 2 = 12.5916 entonces se rechaza H0

Conclusin: Hay suficiente evidencia para concluir que la distribucin no sea uniforme
Prueba Chi-cuadrado de Bondad
de Ajuste: Pasos

1. Formular hiptesis
2. Fijar el nivel de significancia
3. Determinar el valor crtico
4. Calcular el estadstico de prueba, 2
5. Tomar una decisin
6. Interpretar el resultado
Ejemplo: Distribucin Normal
Las medidas obtenidas de un proceso de
produccin siguen una distribucin normal con
= 50 y = 15?, = 0.05.
Proceso:
Obtener datos muestrales.
Agrupar los datos muestrales en clases
(celdas). La frecuencia esperada en cada
celda debe ser al menos 5.
Comparar las frecuencias observadas
(datos muestrales) con las frecuencias
esperadas.
Ejemplo: Distribucin Normal
(continuacin)
Datos muestrales y agrupados en clases:

150 medidas Clase Frecuencia


muestrales
Menos de 30 10
80 [30 40> 21
65 [40 50> 33
36
66 [50 60> 41
50 [60 70> 26
38
[70 80> 10
57
77 [80 90> 7
59 De 90 a ms 2
etc
Total 150
Ejemplo: Distribucin Normal
(continuacin)
Cules son las frecuencias esperadas para las clases
si se asume distribucin normal con = 50 y = 15?
Frecuencia Frecuencia
Clase Observada Esperada
Menos de 30 10
[30 40> 21

[40 50> 33 ?
[50 60> 41
[60 70> 26
[70 80> 10
[80 90> 7
De 90 a ms 2
Ejemplo: Distribucin Normal
(Frecuencias Esperadas)
Frecuencia
Frecuencias espera-
Clase P(X clase) esperada das para un tamao
muestral n=150 de
Menos de 30 0.09121 13.68
una distribucin nor-
[30 40> 0.16128 24.19 mal con =50 y =15
[40 50> 0.24751 37.13
[50 60> 0.24751 37.13 Ejemplo:
[60 70> 0.16128 24.19 30 50
P(x 30) P z
15
[70 80> 0.06846 10.27
P(z 1.3333)
[80 90> 0.01892 2.84
0.0912
De 90 a ms 0.00383 0.57
Total 1.00000 150.00 (0.0912)(1 50) 13.68
Clase
Menos de 30
[30 40>
[40 50>
[50 60>
[60 70>
[70 80>
[80 90>
De 90 a ms
Total
Ejemplo: Distribucin Normal
(Estadstico de Prueba)
Frecuencia
observada, oi
10
21
33
41
26
10
7
2
150
Frecuencia
esperada, ei
13.68
24.19
37.13
37.13
24.19
10.27
2.84
0.57
150.00

(
2 i

22
Estadstico de prueba:
o
ei

Rechazar H0
si
e i ) 2

(con k 1 grados de
libertad)
Ejemplo: Distribucin Normal
(Regin de Rechazo)
H0: La distribucin de las medidas es normal con = 50 y = 15
HA: La distribucin no es normal con = 50 y = 15

Regin de Rechazo:
14.0671 =
2
0.05 (7 g.l., 8 clases)

=0.05

0 No rechazar H0 Rechazar H0 2
Estadstico de prueba:
(oi ei ) 2 (10 13.68) 2 (2 0.57) 2

2
... 12.057
ei 13.68 0.57

Decisin: Como 2 = 12.097 < 2 = 14.0671 entonces no se rechaza H0

Conclusin: No hay suficiente evidencia para concluir que la distribucin de


las medidas no es normal con = 50 y = 15
13-66
Ejemplo: Distribucin
Normal
Importante:

En el ejemplo desarrollado, la hiptesis especificaba


tanto la media, como la desviacin estndar, las
probabilidades de la distribucin normal se
calcularon empleando esos valores.

Si la media y/o la desviacin estndar no fuesen


especificadas, se usaran los datos de la muestra
para su clculo, en cuyo caso se perderan unidades
adicionales de grados de libertad, una por cada
parmetro estimado a partir de la muestra.
Anlisis de Contigencia

Se ha visto pruebas de hiptesis referidas a una o


dos proporciones poblacionales,

Qu de las situaciones que involucran mltiples


proporciones poblacionales?
Ejemplos
Una compaa de fondos mutuos ofrece 6 tipos diferentes de fondos.
Se desea determinar si la proporcin de clientes que selecciona
cada fondo est vinculada o no a las 4 regiones de venta en que
opera la compaa.

El administrador de un hospital recolecta data de satisfaccin con el


servicio de los pacientes a travs de ratings por departamento y
desea saber si hay diferencias significativas entre los mismos.

Un gerente de personal est interesado en determinar si hay una


relacin entre el nivel de satisfaccin del trabajador con su trabajo y
el tipo de trabajo.

En estos tres casos las proporciones se refieren a caractersticas


categricas de la variable de inters.
Anlisis de Contingencia

El procedimiento estadstico de Anlisis de


Contingencia puede ser adecuado para la toma de
decisiones en contextos de mltiples proporciones,
con data de tipo nominal u ordinal y valores
determinados por conteo de nmero de ocurrencias
en cada categora.
Anlisis de Contingencia
Se aplica en situaciones que involucran propor-ciones
poblacionales mltiples.
Los datos deben ser categricos.
Usado para clasificar observaciones muestrales de acuerdo a dos
o ms caractersticas.
Usa el estadstico Chi-cuadrado para determinar independencia de
las caractersticas de inters.
Los datos son resumidos en una tabla de contingencia (tambin
llamada tabla cruzada).
Anlisis de Contingencia:
Ejemplo

Preferencia manual vs. Gnero (dos


variables), =0.05.
Preferencia manual: Izquierda vs. Derecha
Gnero: Masculino vs. Femenino

H0: La preferencia manual es independiente del


gnero
HA: La preferencia manual no es independiente
del gnero
Anlisis de Contingencia:
Ejemplo
(continuacin)
Los resultados muestrales se encuentran
organi-zados en una tabla de contingencia:

Preferencia manual
Tamao muestral n =300
Gnero Izquierda Derecha
De 120 mujeres, 12
son zurdas
Femenino 12 108 120
De 180 hombres, 24
son zurdos Masculino 24 156 180

36 264 300
Lgica de la Prueba

H0: La preferencia manual es independiente del gnero


HA: La preferencia manual no es independiente del gnero

Si H0 es verdadera, entonces la proporcin de


mujeres zurdas debera ser la misma como la
proporcin de hombres zurdos
Las dos proporciones anteriores deberan ser las
mismas como la proporcin de zurdos (femenino
y masculino) del total
Hallando Frecuencias Esperadas

De 120 mujeres, 12 Total:


son zurdas
De 180 hombres, 24 P(Zurdos)
son zurdos = 36/300 = 0.12
Si fueran independientes, entonces
P(Zurdas | Femenino) = P(Zurdos | Masculino) = 0.12

Se esperara que el 12% de 120 (femenino) y el 12% de 180


(masculino) sean zurdos

Es decir: (120)(0.12) = 14.4 mujeres seran zurdas


(180)(0.12) = 21.6 hombres seran zurdos
Hallando Frecuencias Esperadas
(continuacin)
Frecuencias esperadas:

(Total de la fila i ma )(Total de la columna j ma )


eij
Tamao muestral total

Total de mujeres Total de zurdos


Ejemplo: Frecuencia
esperada de
(120)(36)
e11 14.4 mujeres
zurdas
300
Total muestral
Frecuencias Observadas vs.
Esperadas

Preferencia manual

Gnero Izquierda Derecha

Observado = 12 Observado = 108


Femenino 120
Esperado = 14.4 Esperado = 105.6
Observado = 24 Observado = 156
Masculino 180
Esperado = 21.6 Esperado = 158.4
36 264 300

(Total de la fila i ma )(Total de la columna j ma )


eij
Tamao muestral total
Frecuencias Marginales
Una frecuencia marginal es la suma de las
celdas de una fila o columna
Ejemplo, la frecuencia marginal
(femenino) en el estudio fue 12+108=120

La frecuencia marginal esperada para una


categora DEBE SER IGUAL a la frecuencia
marginal observada de la misma categora
Es decir, la frecuencia marginal esperada
(femenino) en el estudio debe tambin
ser 120
Estadstico de Prueba Chi-
cuadrado

El estadstico de prueba Chi-cuadrado es:

r c (oij eij )2

2
con g.l. (r 1)(c 1)
i1 j 1 eij
Donde:
oij = Frecuencia observada en la celda (i, j)
NOTA: Todas las
eij = Frecuencia esperada en la celda (i, j)
filas y columnas
r = Nmero de filas deben ser usadas
c = Nmero de columnas
Estadstico de Prueba
Chi-cuadrado (continuacin)
Preferencia manual

Gnero Izquierda Derecha

Observado = 12 Observado = 108


Femenino 120
Esperado = 14.4 Esperado = 105.6
Observado = 24 Observado = 156
Masculino 180
Esperado = 21.6 Esperado = 158.4
36 264 300

(12 14.4) 2 (108 105.6) 2 (24 21.6) 2 (156 158.4) 2



2
0.7576
14.4 105.6 21.6 158.4
Anlisis de Contingencia

Regla de decisin:
Si 2 > 3.841,
rechazar H0;
3.841= 20.05, g.l.=(r-1)(c-1)=1
en otro caso,
no rechazar H0 = 0.05

No rechazar H0 Rechazar H0

Estadstico de prueba: 0.7576
Decisin: Como 2 = 0.7576 < 3.841, no se rechaza H0
Conclusin: No hay suficiente evidencia para concluir que el gnero y la
preferencia manual no son independientes
Prueba Chi-cuadrado:
Consideraciones
La distribucin chi-cuadrado es solamente una
aproximacin de la verdadera distribucin
Pero es aceptable cuando todas las frecuencias esperadas son
mayores que o iguales a 5
Cuando las frecuencias son menores que 5, el valor del
estadstico de prueba chi-cuadrado podra incrementar la
probabilidad del error tipo I
Como regla, si la hiptesis nula no es rechazada, acepte el
resultado as se tenga celdas con frecuencias esperadas
menores a 5.9.

Si las frecuencias esperadas son pequeas:


Primero, incrementar el tamao muestral
Si es necesario, combinar las categoras de las variables
Resumen

Se us la prueba chi-cuadrado de bondad de


ajuste para determinar si los datos se ajustan a
una distribucin especfica:
Ejemplo de una distribucin uniforme (discreta)
Ejemplo de una distribucin normal (continua)
Se us la prueba chi-cuadrado en tablas de
contingencia para evaluar independencia (anlisis
de contingencia)
Se compar las celdas de frecuencias observadas con
las esperadas.
Gracias

You might also like