You are on page 1of 51

TECNOLGICO NACIONAL DE MXICO

Instituto Tecnolgico de Tijuana

Pruebas de hiptesis con dos muestras y


varias muestras con datos categricos

Tijuana, B.C., 30 de Mayo de 2016

1
ndice
Pruebas de hiptesis con dos muestras y varias
muestras con datos categricos
Introduccin .................................................................................. 3

5.1 Prueba Z para la diferencia entre dos proporciones ................ 4

5.2 Prueba para la diferencia entre dos proporciones .................. 15

5.3 Prueba para la diferencia en n proporciones Z ...................... 19

5.4 Prueba de independencia (ji-cuadrada) .................................32

5.5 Pruebas de contingencia (ji-cuadrada)...................................43

5.6 Pruebas de bondad de ajuste .................................................. 49

Conclusin ................................................................................. 51

Bibliografa/Referencias .............................................................. 51

2
Introduccin

En esta investigacin se revisan las particularidades de cada una de estas pruebas de hiptesis,

estas se realizan comparando las frecuencias observadas y las frecuencias esperadas.

A su vez, estas pruebas con frecuencias observadas y esperadas se muestran como las

pruebas 2 son equivalentes a las pruebas con el estadstico normal Z, las cuales se han

estudiado en unidades anteriores.

El anlisis de datos categricos con propsito de toma de decisiones es de vital importancia

en la investigacin financiera, mdica y de las ciencias sociales. Al efectuar una encuesta, por

ejemplo, las preguntas se redactan, a menudo, de manera que se den respuestas categricas

en lugar de numricas.

Varios estudios resultan en datos que son categricos o cualitativos antes que cuantitativos

y que admiten ms de dos resultados posibles

5.1 Prueba Z para la diferencia entre dos proporciones


3
Cuando se desea probar una hiptesis sobre la diferencia entre 2 proporciones puede
emplearse la distribucin Z si se tienen tamaos de muestra lo suficientemente grandes

1 2

1 1
(1 )( + )
1 2

1 2
=
1 1
(1 )(
1 + 2 )

1 = proporcin de xitos en la muestra 1


2 = proporcin de xitos en la muestra 2
1 = nmero de elementos en la muestra 1
2 = numero de elementos en la muestra 2
= es la combinacin de las 2 proporciones dado que la hiptesis nula supone que son
iguales.

1 + 2
=
1 + 2

1= nmero de casos de xitos en la muestra 1

2= nmero de casos de xitos en la muestra 2

1 2
1 = 2 =
1 2

Ejercicios

4
1. Se desea probar si existe diferencia entre las proporciones de aficionados al futbol que
tienen estudios universitarios. Se encontr que 56 de ellos son aficionados a ese
deporte. Otra muestra de 150 personas que no tienen estudios refleja que 90
manifiestan ser aficionados. Compruebe con una significancia del 0.05 si existe
diferencia entre las proporciones de aficionados de ambas poblaciones.

= 1 = 2
1 = 1 2
= 0.05

= 0.025
2

(1.96 < < 1.96) = 0.05

1 + 2 56 + 90
= = = 0.584
1 + 2 250

1 2 0.56 0.06
= = 9.8788
1 1 1 1
(1 ) ( + ) 0.584 (1 0.584) ( + )
1 2 100 150

Se rechaza Ho, si hay diferencia entre los aficionados.

2. En un invierno con epidemia de gripe, una compaa farmacutica estudio a 200 bebes
para determinar si el nuevo medicamento de la compaa era eficaz despus de dos
das. Entre 120 bebes que tenan gripe y se les suministro el medicamento, 29 se
curaron dentro de dos das. Entre 280 bebes que tenan gripe pero que no recibieron el
frmaco, 56 se curaron dentro de dos das. Hay alguna afirmacin significativa que
apoye la afirmacin de la compaa de la efectividad del medicamento?

= 1 = 2
1 = 1 > 2

1 + 2 29 + 56
= = = 0.2125
1 + 2 120 + 280

1 2 0.2416 0.2
= = = 0.9335
1 1
(1 )( + ) 0.2125 (0.7875)( 1 + 1 )
1 2 20 280

( > 0.9335) = 0.1762

Se acepa Ho, no hay evidencia suficiente para concluir que el nuevo medicamento es ms
efectivo.

3. Una comunidad urbana quiere demostrar que la incidencia de cncer de mama es


mayor en ella que en la de una rural vecina si se encuentra que 20 de 200 mujeres
adultas en la comunidad urbana tienen cncer de mama contra 10 de 150 mujeres
5
adultas en la comunidad rural. Se podra concluir con un nivel de significancia del 5%
que este tipo de cncer prevalece ms en la comunidad urbana?

= 1 = 2
1 = 1 > 2

= 1.645

1 + 2 20 + 10
= = = 0.0857
1 + 2 200 + 150

1 2 0.1 0.06
= = = 1.10
1 1
(1 )( + ) 0.0857 (0.9143)( 1 + 1 )
1 2 200 150

1.10 > 1.645

Se acepa Ho, pues no hay la suficiente evidencia de que este tipo de cncer prevalece ms en
la comunidad urbana.

4. En un proceso de produccin se encontraron 35 artculos defectuosos en una muestra


aleatoria de 500 y se encontraron que 20 defectuosos en otra muestra de 400 artculos
provenientes de otro proceso similar que se lleva a cabo en otra fbrica. Pruebe la
hiptesis de que los productos producen la misma proporcin de artculos defectuosos,
con un nivel de significancia de 1%

= 1 = 2
1 = 1 2

= 2.575

1 + 2 35 + 20
= = = 0.0061
1 + 2 500 + 400

1 2 0.07 0.05
= = = 1.2457
1 1
(1 )( + ) 0.0061 (0.939)( 1 + 1 )
1 2 500 400

Debido a que la z calculada es mayor que -2.575 y menor que 2.575 se acepta la hiptesis
nula y se concluye que los dos procesos producen la misma proporcin de artculos
defectuosos.

Oficina 1 Oficina 2
5. Una empresa que se dedica a n1= 250 n2= 300 elaborar
declaraciones de impuestos desea comparar la
Declaraciones Declaraciones
calidad del trabajo que se realiza en dos de sus
oficinas regionales. Con muestras con errores= con errores= aleatorias de las
declaraciones de impuestos elaboradas en
dichas oficinas y verificando la 35 27 exactitud de los
reportes, la empresa podr estimar la proporcin de
las declaraciones con errores en que incurri cada una de estas oficinas. Suponga que
esta realiza una prueba de hiptesis para determinar si las proporciones de errores en
las dos oficinas son diferentes. Para esto se requiere una prueba de dos colas. La
hiptesis nula y alternativa son las siguientes:

= 1 2 = 0
1 = 1 2 0

= 10%

1 + 2 35 + 27
= = = 0.1127
1 + 2 250 + 300

1 2 0.14 0.09
= = = 1.8463
1 1
(1 )( + ) 0.1127(0.8873)( 1 + 1 )
1 2 250 300

Se rechaza la Ho para un nivel de significancia del 10%. La empresa concluye que las
proporciones de errores de las dos oficinas difieren. La conclusin de esta prueba de
hiptesis es consistente con los resultados de la estimacin por intervalo calculada antes, los
cuales indicaban la diferencia entre las proporciones poblacionales de errores en las dos
oficinas estaba entre 0.005 y 0.095, siendo la oficina 1 la que arrojaba una mayor tasa de
errores.

6. Considere la prueba de hiptesis:


a) Cul es el valor de Pc?
b) Usando una significancia del 5%, Cul es la conclusin en esta prueba de hiptesis?

= 1 2 0 Muestra 1 Muestra 2
1 = 1 2 > 0
n1= 200 n2= 300
= 0.05
P1=0.22 P2=0.16
1 + 2 200(0.22) + 300(0.16)
= =
1 + 2 200 + 300

= 0.1840

1 2 0.22 0.16
= = = 1.70
1 1
(1 )( + ) 0.1840(0.816)( 1 + 1 )
1 2 200 300

a) Valor P= 1.0000-0.9554=0.0446
7
b) Se rechaza Ho

7. En un estudio de la Asociacin Estadounidense de Automovilistas (AAA, por sus siglas en


ingls) se investig si era ms probable que los conductores de gnero masculino o
femenino se detuvieran para solicitar indicaciones sobre cmo llegar a una direccin. Se
preguntaba a los conductores Si usted y su conyugue van en su automvil y se pierden,
se detiene para preguntar por el domicilio que busca? En una muestra representativa
se encontr que 300 de 811 mujeres dijeron que si se detenan para preguntar, mientras
que 255 de 750 hombres dijeron que tambin lo hacan.
Pruebe la hiptesis usando una significancia del 5%, cul es la conclusin a la que se
esperara que llegara AAA?

= 1 2
1 = 1 > 2
= 5%=1.645

1 + 2 300 + 255
= = = 0.3555
1 + 2 811 + 750

1 2 0.3699 0.34
= = = 1.2330
1 1
(1 )( + ) 0.3555(0.6445)( 1 + 1 )
1 2 811 750

Debido a que la z calculada, 1.2330 es menor que 1.645 se acepta la hiptesis nula; no se
puede concluir que las mujeres sean ms propensas a preguntar por un domicilio.

8. Suponga que es el gerente de T.C Resort Properties, un conjunto de cinco hoteles de


gran prestigio localizados en dos islas. En una de las islas T.C Resort tiene dos hoteles, el
Beachcomber y Windsurfer. Al tabular las respuestas para la nica pregunta Elegira
venir a este hotel nuevamente? , 163 de 227 huspedes del hotel Beachcomber
respondieron SI, y 164 de 262 huspedes del Windsurfer respondieron s. Con un nivel
de significancia de 0.05, Existe evidencia para una diferencia significativa en la
satisfaccin de los huspedes entre los dos hoteles?

= 1 = 2
1 = 1 2
= 5%=1.645

1 + 2 163 + 164
= = = 0.648
1 + 2 227 + 262

1 2 0.718 + 0.588
= = = 30.1573
1 1
(1 )( + ) 0.648(0.352)( 1 + 1 )
1 2 227 262

Con un nivel de significancia de 0.05, se rechaza la hiptesis nula puesto que


Z=30.1573>1.645 El valor calculado de p es 0.0026. Existe evidencia para concluir que los dos
hoteles son significativamente diferentes con respecto a la satisfaccin de los huspedes.

8
9. Se ponen a prueba la enseanza de la Estadstica empleando Excel y Winstats. Para
determinar si los estudiantes difieren en trminos de estar a favor de la nueva
enseanza se toma una muestra de 20 estudiantes de dos paralelos. De paralelo A 18
estn a favor, en tanto que del paralelo B estn a favor 14. Es posible concluir con un
nivel de significacin de 0,05 que los estudiantes que estn a favor de la nueva
enseanza de la Estadstica es la misma en los dos paralelos?

= 1 = 2
1 = 1 2
= 5%=1.645

1 + 2 18 + 14
= = = 0.8
1 + 2 20 + 20

1 2 0.9 0.7
= = = 1.5811
1 1
(1 )( + ) 0.8(0.2)( 1 + 1 )
1 2 20 20

La hiptesis nula es aceptada, ya que Z=1.5811 est en la zona de aceptacin de la regin


critica 1.96, por lo tanto la proporcin de los estudiantes a favor de la nueva enseanza
estadstica es la misma en los dos paralelos.

10. Un estudio de mercadotecnia refleja mediante una muestra aleatoria que 35 de 50


nios de Tijuana y 32 de 50 de Puebla, prefieren videojuegos de una marca especfica.
Pruebe la hiptesis de que estas proporciones son iguales con un nivel de significancia
de 0.025.

= 1 = 2
1 = 1 2
= 0.025 = 1.96

1 + 2 35 + 32
= = = 0.67
1 + 2 50 + 50

1 2 0.7 0.64
= = = 0.6380
1 1
(1 )( + ) 0.67(0.33)( 1 + 1 )
1 2 50 50

Debido a que la z calculada, 0.6380 es menor que 1.96 se acepta la hiptesis nula; de que las
proporciones son iguales.

9
11. Un empresario tomo una muestra aleatoria de 100 empleados del rea administrativa y
otra de 500 de la operativa. Encontr que 8 y 25, respectivamente, no estn cumpliendo
con su trabajo. Determine con un nivel de significancia de 1% si la hiptesis de que las
proporciones de trabajadores con esta caractersticas es la misma en las 2 reas.

= 1 = 2
1 = 1 2
= 0.10 = 1.285

1 + 2 8 + 25
= = = 0.055
1 + 2 100 + 500

1 2 0.08 0.05
= = = 1.2012
1 1
(1 )( + ) 0.055(0.945)( 1 + 1 )
1 2 100 500

Debido a que la z calculada, 1.2012 es menor que 1.285 se acepta la hiptesis nula; de que
las proporciones de los trabajadores con esta caracterstica es la misma en las 2 reas.

12. Una empresa de telecomunicaciones toma una muestra aleatoria de 70 llamadas


locales, de las cuales 20 tienen una duracin superior a 15 minutos. Otra muestra
aleatoria de 50 llamadas internacionales refleja que solo 15 rebasan este tiempo.
Tomando en cuenta con un nivel de significancia de 5% pruebe la hiptesis de que la
proporcin de llamadas que duran ms de 15 minutos entre locales e internacionales es
la misma.

= 1 = 2
1 = 1 2
= 0.05 = 1.645

1 + 2 20 + 15
= = = 0.2916
1 + 2 70 + 50

1 2 0.2857 0.3
= = = 0.1699
1 1
(1 )( + ) 0.2916(0.7084)( 1 + 1 )
1 2 70 50

Debido a que la z calculada0.1699 es menor que 1.645 se rechaza la hiptesis nula; y se


concluye que la proporcin de llamadas que duran ms de 15 minutos entre locales e
internacionales es diferente.

10
13. Un laboratorio toma una muestra aleatoria de 150 pacientes hombres y 200 pacientes
mujeres a quienes se les aplico un tratamiento. Al cabo de 10 das 100 hombres y 180
mujeres muestran mejora gracias al tratamiento. Con un nivel de significacin de 1%
determine si la proporcin es la misma para hombres y mujeres que tuvieron una buena
reaccin.

= 1 = 2
1 = 1 2
= 0.01 = 2.575

1 + 2 100 + 180
= = = 0.8
1 + 2 150 + 200

1 2 0.6666 0.9
= = = 5.4021
1 1
(1 )( + ) 0.8(0.20)( 1 + 1 )
1 2 150 200

Debido a que la z calculada 5.4021 es mayor que 2.575, se acepta la hiptesis nula; y se
concluye que la proporcin de hombres y mujeres que tuvieron una buena reaccin es la
misma.

14. Un banco compara 2 sucursales esperando que la proporcin de transacciones que


generan comisin alta sea la misma. De una muestra aleatoria de 600 transacciones de
la sucursal 1, 270 generan una comisin alta; de otra muestra aleatoria de 720
transacciones de la sucursal 2, 340 cumplen con esta caracterstica. Pruebe con un nivel
de significacin de 0.05% la hiptesis de que esta proporcin es la misma en las 2
sucursales.

= 1 = 2
1 = 1 2
= 0.05 = 1.645

1 + 2 270 + 340
= = = 0.4621
1 + 2 600 + 720

1 2 0.45 0.4722
= = = 0.8055
1 1
(1 )( + ) 0.4621(0.5379)( 1 + 1 )
1 2 600 720

Debido a que la z calculada 0.8055 es menor r que el valor z de tablas 1.645, se rechaza la
hiptesis nula; y se concluye que la proporcin de transacciones que generan comisin alta es
diferente.

11
15. Una esttica toma una muestra aleatoria de 100 clientas de las cuales 25 prefieren el
gelish. Otra muestra aleatoria de 100 clientas de las cuales 50 prefieren las uas de
acrlico. Con un nivel de significacin de 1% determine si la proporcin es la misma de
las que prefieren gelish a las que prefieren uas de acrlico.

= 1 = 2
1 = 1 2
= 0.01 = 2.575

1 + 2 25 + 50
= = = 0.375
1 + 2 100 + 100

1 2 0.25 0.5
= = = 3.6515
1 1
(1 )( + ) 0.375(0.625)( 1 + 1 )
1 2 100 100

Debido a que la z calculada -3.6515 es menor que el valor z de tablas 2.575, se rechaza la
hiptesis nula; y se concluye que la proporcin de las que prefieren gelish y uas acrlicas es
diferente.

16. Un laboratorio toma una muestra aleatoria de 500 pacientes hombres y 450 pacientes
mujeres a quienes se les aplico un tratamiento. Al cabo de 25 das 100 hombres y 180
mujeres muestran mejora gracias al tratamiento. Con un nivel de significacin de 5%
determine si la proporcin es la misma para hombres y mujeres que tuvieron una buena
reaccin.

= 1 = 2
1 = 1 2
= 0.05 = 1.645

1 + 2 100 + 180
= = = 0.2947
1 + 2 500 + 450

1 2 0.2 0.4
= = = 6.7512
1 1
(1 )( + ) 0.2947(0.7053)( 1 + 1 )
1 2 500 450

Debido a que la z calculada -6.7512 es menor que el valor z de tablas 1.645, se rechaza la
hiptesis nula; y se concluye que la proporcin de hombres y mujeres que tuvieron una
buena reaccin es diferente.

12
17. Un estudio de mercadotecnia refleja mediante una muestra aleatoria que 200 de 500
nios de San Diego y 250 de 550 de Florida, prefieren las hamburguesas de una marca
especfica. Pruebe la hiptesis de que estas proporciones son iguales con un nivel de
significancia de 0.025.

= 1 = 2
1 = 1 2
= 0.025 = 1.96

1 + 2 200 + 250
= = = 0.4285
1 + 2 500 + 550

1 2 0.4 0.45
= = = 1.6351
1 1
(1 )( + ) 0.4285(0.5715)( 1 + 1 )
1 2 500 550

Debido a que la z calculada, -1.6351 es menor que 1.96 se acepta la hiptesis nula; de que las
proporciones son iguales.

18. Un ejecutivo de Deloitte tomo una muestra aleatoria de 300 empleados del rea
administrativa y otra de 500 de la operativa. Encontr que 50 y 45, respectivamente, no
estn cumpliendo con su trabajo. Determine con un nivel de significancia de 1% si la
hiptesis de que las proporciones de trabajadores con esta caractersticas es la misma
en las 2 reas.

= 1 = 2
1 = 1 2
= 0.10 = 1.285

1 + 2 50 + 45
= = = 0.1187
1 + 2 300 + 500

1 2 0.16 0.09
= = = 2.9635
1 1
(1 )( + ) 0.1187(0.8813)( 1 + 1 )
1 2 300 500

Debido a que la z calculada, 2.9635 es mayor que 1.285 se rechaza la hiptesis nula; de que
las proporciones de los trabajadores con esta caracterstica es la misma en las 2 reas y se
concluye que son diferentes.

13
19. Una firma de abogados toma una muestra aleatoria de 50 empleados del rea penal y
otra de 60 del rea familiar. Encontr que 10 y 20, respectivamente, no estn llegando a
su trabajo puntualmente. Determine con un nivel de significancia de 10% si la hiptesis
de que las proporciones de los abogados con esta caracterstica es la misma en las 2
reas.

= 1 = 2
1 = 1 2
= 0.10 = 1.285

1 + 2 10 + 20
= = = 0.2727
1 + 2 50 + 60

1 2 0.2 0.33
= = = 1.5244
1 1
(1 )( + ) 0.2727(0.7273)( 1 + 1 )
1 2 50 60

Debido a que la z calculada, -1.5244 es menor que 1.285 se acepta la hiptesis nula; de que
las proporciones de los trabajadores con esta caracterstica es la misma en las 2 reas.

20. La directora del plantel toma muestra aleatoria de 100 nios de segundo de primaria y
otra de 80 de tercero de primaria.Encontr que 45 y 65, respectivamente, no estn
desayunando correctamente en sus casas. Determine con un nivel de significancia de 1%
si la hiptesis de que las proporciones de alumnos con esta caractersticas es la misma
en los dos grados.

= 1 = 2
1 = 1 2
= 0.10 = 1.285

1 + 2 45 + 65
= = = 0.6111
1 + 2 100 + 80

1 2 0.45 0.81
= = = 4.9228
1 1
(1 )( + ) 0.611(0.389)( 1 + 1 )
1 2 100 80

Debido a que la z calculada, -4.9228 es menor que 1.285 se acepta la hiptesis nula; de que
las proporciones de los alumnos con esta caracterstica es la misma en en los dos grados.

14
5.2 Prueba para la diferencia entre dos proporciones

Las pruebas de hiptesis a partir de proporciones se realizan casi en la misma forma utilizada
cuando nos referimos a las medias, cuando se cumplen las suposiciones necesarias para cada
caso. Pueden utilizarse pruebas unilaterales o bilaterales dependiendo de la situacin
particular.
En caso de que la muestra sea grande n>30, el estadgrafo de prueba es: se distribuye normal
estndar.
Regla de decisin: se determina de acuerdo a la hiptesis alternativa (si es bilateral o
unilateral. En el caso de muestras pequeas se utiliza la distribucin Binomial. No lo
abordaremos por ser complicado y poco frecuente su uso.

1. En un proceso de produccin se encontraron 35 artculos defectuosos en una muestra


aleatoria de 500 y se encontraron que 20 defectuosos en otra muestra de 400 artculos
provenientes de otro proceso similar que se lleva a cabo en otra fbrica. Pruebe la
hiptesis de que los productos producen la misma proporcin de artculos defectuosos,
con un nivel de significancia de 1%

= 1 = 2
1 = 1 2

( 2 3.84| = 1) = 0.05
= (2 1)(2 1) = 1

2
( )2
= = 1.5528

= (2 3.8411 , = 1) = 0.05
= (2 6.635 , = 1) = 0.01

15
Debido a que el valor calculado de Chi2 igual a 1.5528 es menor que el valor crtico, no puede
rechazarse la hiptesis nula. Se concluye que los dos procesos tienen la misma proporcin de
artculos defectuosos.

2. Una empresa realiza evaluaciones a sus dos productos ms vendidos. Con una muestra
aleatoria de 250 artculos del producto A y 200 del B, se obtiene que: 230 y 190 pasan
las pruebas de acuerdo con las normas de produccin respectivamente. El jefe de
operaciones mantiene la hiptesis de que las dos lneas de produccin tienen la misma
proporcin de artculos que cumplen con la norma. Comprubelo con un nivel de
significancia de 5%.

( )2
2 = = 1.6086

3. Una compaa tiene dos fundidoras de tamaos similares y dedicados a las mismas
operaciones de produccin. Se implanta un programa de seguridad experimental en una
de ellas. Antes de emplear el programa a la otra los administradores desean comparar la
proporcin de trabajadores lesionados durante el periodo de prueba en el sitio
experimental contra el de la otra planta. Se piensa que el programa es rentable si las
proporciones difieren en ms de 0.05

0 : 1 2 = 0.05
: 1 2 > 0.05

24 + 5
= = 0.565
263 + 250
2
( 6.635, = 1) = 0.01
( )2
2 = = 12.2415

12.2415 > 6.635

16
4. La siguiente tabla muestra las frecuencias observadas y las frecuencias esperadas al
lanzar un dado 60 veces. Contrastar la hiptesis de que el dado es bueno, con un nivel
de significacin de 0,01.

0 :
:

= (2 1)(6 1) = 5
2
= 15.086
(6 10)2 (8 10)2 (9 10)2 (15 10)2 (14 10)2 (8 10)2
2 = + + + + +
10 10 10 10 10 10
2 = 6.6

Se acepta la hiptesis nula, ya que 2 = 6.6 es menor que X tabla 15.086, por lo tanto se
concluye que todas las proporciones de la poblacin son iguales.

5. Se realiza un estudio sobre el cncer de piel en ancianos y su relacin con el hbito de


fumar. Suponemos que hubo 15 casos de cncer en un total de 35 fumadores y 10 casos
de cncer entre un total de 50 no fumadores.

0 : =
:

25-10,3 =14.7 no fumadores con cncer


35-10,3 =24.7 fumadores sin cncer
60-24,7 =35.3 no fumadores sin cncer
(15 10.3)2 (10 14.7)2 (20 24.7)2 (40 35.3)2
2 = + + +
10.3 14.7 24.7 35.3
2 = 5.16
= (2 1)(2 1) = 1

Como conclusin, podemos afirmar que la diferencia es estadsticamente significativa y tenemos


evidencias para rechazar la hiptesis nula ya que le corresponde un valor p<0.05.
Podemos decir que existe una asociacin estadsticamente significativa entre ser fumador y la
incidencia de cncer de piel en ancianos (se puede afirmar que existen evidencias de un mayor riesgo
de cncer de piel entre fumadores).

17
6. Comparar si el factor gnero influyes en la cantidad de cigarros fumados por causa del
estrs en personas que trabajan. El modelo experimental tiene dos muestras
independientes.

0 : No habr diferencia significativa entre la cantidad de cigarros fumados por causa del estrs en hombres y
mujeres que trabajan
: Habr diferencia significativa entre la cantidad de cigarros fumados por causa del estrs en hombres y
mujeres que trabajan
= 0.05

(15 15.9)2 (10 6.81)2 (25 27.7)2 (20 19.09)2 (5 8.18)2 (35 32.7)2
2 = + + + + +
15.9 6.81 27.7 19.09 8.18 32.7
2 = 3.15
= (3 1)(2 1) = 2

El valor 3.15 con 2 grados de libertad se compara con los valores crticos de ji cuadrada; as, se puede
observar que a la cifra 5.99 corresponde la probabilidad de 0.05, lo cual significa que el estadstico
calculado tiene una probabilidad mayor que 0.05.
Decisin: En razn de que el valor de ji cuadrada de 3.15 tiene una probabilidad mayor que 0.05, cae
en la zona de rechazo. Por tanto se acepta Ho y se rechaza Ha. X2c < X2t se rechaza Ho
3.15 > 5.99 se rechaza Ho. Si hay diferencias significativas entre el consumo de cigarros por causa del
estrs entre hombres y mujeres que trabajan.

El consumo de cigarros por causa del estrs entre hombres y mujeres que trabajan, se debe a factores
del azar.

18
5.3 Prueba para la diferencia en n proporciones Z

El procedimiento de prueba de hiptesis de la diferencia entre dos proporciones se puede


extender a cualquier nmero de proporciones
Una distribucin poblacional representa la distribucin de valores de una poblacin y una
distribucin muestral representa la distribucin de los valores de una muestra. En contraste
con las distribuciones de mediciones individuales, una distribucin muestral es una
distribucin de probabilidad que se aplica a los valores posibles de una estadstica muestral.

As, la distribucin muestral de la media es la distribucin de probabilidad de los valores


posibles de la media muestral con base en un determinado tamao de muestra.
Para cualquier tamao de muestra dado n, tomado de una poblacin con media, los valores
de la media muestral varan de una muestra a otra. Esta variabilidad sirve de base para la
distribucin muestral. La distribucin muestral de la media se describe determinando el valor
esperado o la media de la distribucin y la desviacin estndar de la distribucin de las
medias, como esta desviacin estndar indica la precisin de la media muestral como
estimador puntual, por lo general se denomina erro estndar de la media.

Ejercicios

1. En una facultad universitaria se presenta una propuesta para cambiar el plan de estudios
y se desea saber si los estudiantes de cada grado tienen la misma opinin sobre la
propuesta. Para ello, se toman muestras aleatorias de 100 estudiantes de cada uno de los
4 niveles que se cursan. Los resultados se presentan en la siguiente tabla:

= 1 = 2 = 3 = 4
1 =

= (4 1)(2 1) = 3
( 2 11.45; = 3) = 0.01
( 2 7.815 ; = 3) = 0.05

( )2
2 = = 3.9828 + 0.6618 = 4.6443

El valor crtico calculado es menor que el valor critico por lo tanto no es posible rechazar la Ho y se
concluye que las proporciones de los estudiantes de los diferentes niveles que estn a favor al cambio
en el plan de estudios son iguales.

19
2. Para evaluar si el nivel educativo est relacionado con las preferencias polticas se tom
una muestra de ciudadanos en edad de votar a fin de preguntarles sobre sus preferencias
en trminos de partidos polticos. Se obtuvieron los siguientes resultados:

Pruebe si estas dos variables son independientes a un nivel de significancia de 0.05

=
1 =

= (5 1)(2 1) = 4
( 2 9.488; = 4) = 0.05

( )2
2 = = 6.7081 + 319.8381 = 326.5461

El valor crtico calculado, 326.5461, es mayor que el valor crtico, 9.488 por lo tanto se rechaza la
hiptesis nula y se concluye que el nivel educativo no est relacionado con las preferencias polticas.

3. Una agencia de medios desea determinar si existen diferencias en las proporciones de


personas que recuerdan un anuncio de servicios financieros publicitados en 3 medios
diferentes: Televisin, radio y prensa. Los resultados de un estudio de mercado son los
siguientes:

Compruebe la hiptesis de que son iguales las 3 proporciones de personas que recordaron el auncio,
con un nivel de significancia de 0.05.

= 1 = 2 = 3 = 4
1 =

= (2 1)(3 1) = 2
( 2 5.991; = 2) = 0.05

( )2
2 = = 10.7606 + 0.6792 + 5.3578 = 16.7975

20
El valor crtico calculado, 16.7995, es mayor que el valor crtico, 5.991 por lo tanto se rechaza la
hiptesis nula y se concluye que no existe diferencia entre las proporciones de personas que
recuerdan e anuncio de servicios financieros publicitados en los 3 medios diferentes.

4. Una universidad desea probar la hiptesis de que son iguales las proporciones de
estudiantes de varias licenciaturas que tienen acceso a internet en su casa. Para realizar la
prueba se obtienen muestras de estudiantes a quienes se les pregunto si tienen acceso a
internet en su vivienda. Los resultados son los siguientes:

Compruebe la hiptesis con un nivel de significancia de 0.025


= 1 = 2 = 3 = 4
1 =

= (2 1)(3 1) = 2
( 2 7.378; = 2) = 0.025

( )2
2 = = 0.9333 + 0.1875 + 0.1956 = 1.3164

El valor crtico calculado, 1.3164, es menor que el valor crtico, 7.378 por lo tanto se acepta la
hiptesis nula y se concluye que cuando menos una de las igualdades anteriores no se cumple.

5. Una empresa distribuidora de artculos de consumo percederos est interesada en saber


si la renovacin de sus productos en los anaqueles se lleva a cabo con la frecuencia
adecuada. Para saberlo, toma muestra de expendios ubicados en 3 de sus regiones de
distribucin y obtienen los resultados que se muestran en la tabla siguiente:

Utilice un nivel de significancia de 1% para probar la hiptesis de que son iguales las proporciones de
los expendios en las 4 regiones donde la renovacin de los artculos es adecuada.

= 1 = 2 = 3 = 4
1 =

= (2 1)(3 1) = 2
( 2 9.210; = 2) = 0.01

( )2
2 = = 0.2155 + 1.3867 + 0.5141 = 2.1162

El valor crtico calculado, 2.1162, es menor que el valor crtico, 9.210 por lo tanto se acepta la
hiptesis nula y se concluye que cuando menos una de las igualdades anteriores no se cumple.
21
6. En un estudio de mercado se pregunt a muestras independientes de 120 hombres, 100
mujeres y 100 nios si les agradaba o no el sabor de la nueva pasta dental en proceso de
desarrollo, los resultados se muestran a continuacin:

Compruebe la hiptesis de que las proporciones de hombres, mujeres y nios a los que les gusta la
pasta dental son iguales, con un nivel de significacin de 1%

= 1 = 2 = 3 = 4
1 =

= (2 1)(3 1) = 2
( 2 9.210; = 2) = 0.01

( )2
2 = = 0.9305 + 0.8666 + 0.0158 = 1.8129

El valor crtico calculado, 1.8129, es menor que el valor crtico, 9.210 por lo tanto se acepta la
hiptesis nula y se concluye que cuando menos una de las igualdades anteriores no se cumple.

7. Las matemticas son una asignatura obligatoria en las 3 licenciaturas que imparten en la
Facultad de Administracin. Se toma una muestra aleatoria para evaluar si la calificacin
de los alumnos en el curso bsico es independiente de la licenciatura que han elegido Los
resultados son los siguientes:

Pruebe si estas dos variables son independientes, con un nivel de significancia de 1%

=
1 =

= (2 1)(3 1) = 2
( 2 9.210; = 2) = 0.01

( )2
2 = = 1.3568 + 2.0513 + 0.4615 = 3.8696

El valor crtico calculado, 3.8696, es menor que el valor crtico, 9.210 por lo tanto se acepta la
hiptesis nula y se concluye que la calificacin de los alumnos es dependiente de la licenciatura que
han elegido.

22
8. Se realiz una encuesta para determinar si la edad est relacionada con la opinin de los
ciudadanos sobre el tipo de seguridad social para los trabajadores, y se obtuvieron los
siguientes resultados:

Pruebe si estas 2 variables son independientes con un nivel de significancia de 0.05

=
1 =

= (2 1)(3 1) = 2
( 2 5.991; = 2) = 0.05

( )2
2 = = 0.7856 + 0.4076 + 0.0056 = 1.1988

El valor crtico calculado, 1.1988, es menor que el valor crtico, 5.991 por lo tanto se acepta la
hiptesis nula y se concluye que la edad es independiente de la opinin de los ciudadanos sobre el
tipo de seguridad social.

9. Con los datos siguientes, pruebe si el estado civil es independiente de la edad con un nivel de
significancia de 0.05

=
1 =

= (2 1)(3 1) = 2
( 2 5.991; = 2) = 0.05

( )2
2 = = 16.3798 + 0.0447 + 8.9542 = 25.3778

El valor crtico calculado, 25.3778, es mayor que el valor crtico, 5.991 por lo tanto se rechaza la
hiptesis nula y se concluye que el estado civil es dependiente de la edad.

23
10. Con los datos siguientes, pruebe si la puntualidad es independiente de las horas que duermen los
trabajadores con un nivel de significancia del 5%

=
1 =

= (2 1)(3 1) = 2
( 2 5.991; = 2) = 0.05

( )2
2 = = 0.0293 + 3.2059 + 1.3943 = 4.6295

El valor crtico calculado, 4.6295, es menor que el valor crtico, 5.991 por lo tanto se acepta la
hiptesis nula y se concluye la puntualidad es independiente a las hrs que duermen los trabajadores.

11. Con los datos siguientes, pruebe si los hbitos alimenticios dependen de la edad, con un nivel de
significancia del 10%

=
1 =

= (2 1)(3 1) = 2
( 2 4.605; = 2) = 0.10

( )2
2 = = 12.7011 + 6.4834 + 5.3705 = 24.5549

El valor crtico calculado, 24.5549, es mayor que el valor crtico, 4.605 por lo tanto se rechaza la
hiptesis nula y se concluye que los hbitos alimenticios son independientes a la edad.

24
12. En un gimnasio se quiere probar que las nuevas inscripciones dependen de las vacaciones de sus
socios, pruebe con un nivel de significancia del 0.005

=
1 =

= (2 1)(3 1) = 2
( 2 10.597; = 2) = 0.005

( )2
2 = = 16.2338 + 13.7671 + 0.1959 = 30.1968

El valor crtico calculado, 30.1968, es mayor que el valor crtico, 10.597 por lo tanto se rechaza la
hiptesis nula y se concluye que las nuevas inscripciones son independientes a las vacaciones de sus
socios.

13. En un restaurante se quiere probar que las propinas hacia sus meseros dependen del consumo de
los clientes, pruebe con un nivel de significancia del 1%

=
1 =

= (2 1)(3 1) = 2
( 2 9.210; = 2) = 0.01

( )2
2 = = 7.5089 + 1.5750 + 0.7619 = 9.8458

El valor crtico calculado, 9.8458, es menor que el valor crtico, 9.210 por lo tanto se acepta la
hiptesis nula y se concluye las propinas hacia sus meseros dependen del consumo de sus clientes.

14. Una secundaria quiere probar que los alumnos que reprueban matemticas es dependiente al
uso excesivo de los videojuegos, internet u otros, con un nivel de significancia del 0.005.

=
1 =

= (2 1)(3 1) = 2
( 2 10.597; = 2) = 0.005
( )2
2 = = 2.0631 + 0.8336 + 11.9858 = 14.8825

25
El valor crtico calculado, 14.8825, es mayor que el valor crtico, 10.597 por lo tanto se rechaza la
hiptesis nula y se concluye los alumnos que reprueban matemticas es independiente al uso
excesivo de videojuegos, internet u otros.

15. Una compaa de telfonos desea saber si la preferencia de sus dos planes depende de la ciudad
donde se contrata, con un nivel de significancia del 0.005.

=
1 =

= (2 1)(3 1) = 2
( 2 10.597; = 2) = 0.005
( )2
2 = = 10 + 2 + 4 = 16

El valor crtico calculado, 16, es mayor que el valor crtico, 10.597 por lo tanto se rechaza la hiptesis
nula y se concluye que la preferencia de sus dos planes depende de la ciudad donde se contrata

16. Una marca reconocida de zapatos deportivos desea saber si la preferencia de su producto
depende de la edad de sus consumidores, con un nivel de significancia del 0.025

=
1 =

= (2 1)(3 1) = 2
( 2 7.378; = 2) = 0.05
( )2
2 = = 20.7692 + 22.2236 + 0.6731 = 43.6659

El valor crtico calculado, 43.6659, es mayor que el valor crtico, 7.378 por lo tanto se rechaza la
hiptesis nula y se concluye que la preferencia de sus zapatos deportivos depende de la edad de sus
consumidores.

26
17. Una marca de detergente desea saber si la preferencia de sus dos presentaciones es dependiente
de su ocupacin con un nivel de significancia del 1%

=
1 =

= (2 1)(3 1) = 2
( 2 6.635; = 2) = 0.01
( )2
2 = = 22.8023 + 79.3052 + 25.1209 = 127.2284

El valor crtico calculado, 127.2284, es mayor que el valor crtico, 6.635 por lo tanto se rechaza la
hiptesis nula y se concluye que la preferencia es independiente de su ocupacin.

18. Una marca de maquillaje desea saber si la preferencia del color de los labiales es dependiente a la
estacin del ao con un nivel de significancia del 10%

=
1 =

= (2 1)(3 1) = 2
( 2 4.605; = 2) = 0.1
( )2
2 = = 43.1876 + 2.5521 + 9.7547 = 55.4944

El valor crtico calculado, 55.4944, es mayor que el valor crtico, 4.605 por lo tanto se rechaza la
hiptesis nula y se concluye que la preferencia del color de los labiales es independiente de la
estacin del ao.

19. La secretaria de salud desea saber si los litros consumidos de agua son dependientes a la
ocupacin de la poblacin con un nivel de significancia de 0.005

=
1 =

= (2 1)(3 1) = 2
( 2 10.597; = 2) = 0.005
( )2
2 = = 7.5938 + 5.0417 + 22.2315 = 34.8669

El valor crtico calculado, 34.8669, es mayor que el valor crtico, 10.597 por lo tanto se rechaza la
hiptesis nula y se concluye que la preferencia del color de los labiales es independiente de la
estacin del ao.

27
20. Una agencia de viajes desea probar la hiptesis de que el desempeo de sus agentes de ventas es
dependiente a la experiencia que tienen en el rea de ventas, con un nivel de significancia del 5%.

=
1 =

= (2 1)(3 1) = 2
( 2 5.991; = 2) = 0.05
( )2
2 = = 0.0130 + 1.3807 + 1.7376 = 3.1313

El valor crtico calculado, 3.1313, es menor que el valor crtico, 5.991 por lo tanto se acepta la
hiptesis nula y se concluye que el desempeo de sus agentes de ventas es independiente a la
experiencia en el rea.

21. Un estudio realizado por el ITT desea saber si exsite dependencia del banco que usan los
estudiantes de la institucin con respecto a la edad de los mismos, con un nivel de significancia
del 0.50.

=
1 =

= (2 1)(3 1) = 2
( 2 1.386; = 2) = 0.50
( )2
2 = = 0.2888 + 0.3143 + 0.0059 = 0.6090

El valor crtico calculado, 0.6090, es menor que el valor crtico, 1.386 por lo tanto se acepta la
hiptesis nula y se concluye que el banco que usan los estudiantes del ITT si depende de la edad de los
mismos.

22. Una empresa de cerveza artesanal desea saber si la edad de sus consumidores es dependiente a la
bebida que desean tomar, con un nivel de significancia del 0.005

=
1 =
= (2 1)(3 1) = 2
( 2 10.597; = 2) = 0.005
( )2
2 = = 2.5855 + 6.3516 + 22.5723 = 31.5095

28
El valor crtico calculado, 31.5095, es mayor que el valor crtico, 10.597 por lo tanto se rechaza la
hiptesis nula y se concluye que la edad de sus consumidores es dependiente de la bebida que
prefieren tomar.

23. El profesor que imparte Ing. Econmica desea saber si las calificaciones de su grupo son
dependientes a las horas de estudio que ellos dedican antes del examen, con un nivel de significancia
del 5%

=
1 =
= (2 1)(3 1) = 2
(5.991; = 2) = 0.05
( )2
2 = = 0.0275 + 1.4066 + 0.9423 = 2.3764

El valor crtico calculado, 2.3764, es menor que el valor crtico, 5.991 por lo tanto se acepta la
hiptesis nula y se concluye que las calificaciones de su grupo son dependientes a las hrs de estudio
que ellos dedican antes del examen.

24. En una encuesta pre electoral realizada a 200 personas se obtuvo la siguiente tabla:

Pruebe la hiptesis de que la intencin del voto es independiente a la edad de las personas con un
nivel de significancia del 0.05%

=
1 =
= (2 1)(3 1) = 2
(5.991; = 2) = 0.05
( )2
2 = = 15.1629 + 2.0995 + 6.0652 = 23.3275

El valor crtico calculado, 23.3275, es mayor que el valor crtico, 5.991 por lo tanto se rechaza la
hiptesis nula y se concluye que la intencin del voto es dependiente a la edad de las personas.

29
25. El gerente de un centro comercial quera saber si hay diferencias en la proporcin de mujeres
compradoras a diversas horas durante diversos das de la semana. Se seleccionaron muestras
aleatorias de 300 clientes en el da, 300 en la noche y 400 compradores en los fines de semana;
obtenindose los siguientes resultados:

Pruebe la hiptesis con un nivel de significancia del 0.005


= No existe diferencia en las proporciones
1 = Existe diferencia en las proporciones
= (2 1)(3 1) = 2
(10.597; = 2) = 0.005
( )2
2 = = 12.50 + 0.3472 + 6.5104 = 19.3576

El valor crtico calculado, 19.3576, es menor que el valor crtico, 10.597 por lo tanto se acepta la
hiptesis nula y se concluye si hay diferencia en la proporcin de mujeres compradoras a diversas hrs
durante diversos das de la semana.

26. Una tienda de souvenirs desea saber si la proporcin de sus ventas es dependiente al mes del ao,
con un nivel de significancia del 0.05%

= La proporcin de sus ventas es dependiente al mes del ao


1 = La proporcin de sus ventas es independiente al mes del ao
= (2 1)(3 1) = 2
(5.991; = 2) = 0.05
( )2
2 = = 39.0950 + 3.1060 + 26.2629 = 19.3576

El valor crtico calculado, 19.3576, es mayor que el valor crtico, 5.991 por lo tanto se rechaza la
hiptesis nula y se concluye que la proporcin de sus ventas es independiente al mes del ao.

27. Una universidad desea saber si el nmero de alumnos que sufren algn tipo de accidente es
dependiente al semestre que estn cursando. Pruebe con un nivel de significancia del 5%

= El nmero de alumnos que sufren algn tipo de accidente es dependiente al semestre que cursan
1 = El nmero de alumnos que sufren algn tipo de accidente es independiente al semestre que cursan
= (2 1)(3 1) = 2
(5.991; = 2) = 0.05
( )2
2 = = 10.6734 + 3.0415 + 1.3824 = 15.0973

30
El valor crtico calculado, 15.0973, es menor que el valor crtico, 5.991 por lo tanto se acepta la
hiptesis nula y se concluye el nmero de alumnos que sufren algn tipo de accidente es dependiente
al semestre que cursan.

28. La cervecera Moctezuma desea saber si la proporcin de sus consumidores es dependiente a la


carrera que estudian, con un nivel de significancia del 5%

= La proporcin de sus consumidores es dependiente a la carrera que estudian


1 = La proporcin de sus consumidores es independiente a la carrera que estudian
= (2 1)(3 1) = 2
(5.991; = 2) = 0.05
( )2
2 = = 1.6667 + 0.3846 + 4.50 = 6.5513

El valor crtico calculado, 6.5513, es menor que el valor crtico, 5.991 por lo tanto se acepta la
hiptesis nula y se concluye; La proporcin de sus consumidores es dependiente a la carrera que
estudian.

29. Una papelera escolar desea saber si la proporcin de las calculadoras que vende depende de la
carrera que estudian sus clientes. Compruebe la hiptesis con un nivel de significancia del 5%

= La proporcin de las calculadoras que vende depende de la carrera que estudian sus clientes
1 = La proporcin de las calculadoras que vende es independiente de la carrera que estudian sus clientes
= (2 1)(3 1) = 2
(5.991; = 2) = 0.05
( )2
2 = = 4.1220 + 4.5844 + 4.8139 = 13.5003

El valor crtico calculado, 13.5003, es menor que el valor crtico, 5.991 por lo tanto se rechaza la
hiptesis nula y se concluye; la proporcin de las calculadoras que vende es independiente de la
carrera que estudian sus clientes.

31
30. Una papelera escolar desea saber si la marca de plumas que vende depende de la edad de sus
clientes. Compruebe la hiptesis con un nivel de significancia del 5%

= La proporcin de la marca de plumas depende de la edad de sus clientes


1 = La proporcin de la marca de plumas depende de la edad de sus clientes
= (2 1)(3 1) = 2
(5.991; = 2) = 0.05
( )2
2 = = 3.7220 + 9.6240 + 6.5691 = 19.9151

El valor crtico calculado, 19.9151, es menor que el valor crtico, 5.991 por lo tanto se acepta la
hiptesis nula y se concluye; que la proporcin de la marca de plumas depende de la edad de sus
clientes.

32
5.4 Prueba de independencia (ji-cuadrada)

Es importante distinguir una caracterstica sobre estos casos; se trata de una muestra se trata
de una muestra de elementos clasificados de acuerdo con 2 variables y 2 criterios. Por
ejemplo, saber si la orientacin poltica es independiente del nivel educativo; si la calidad de
cierto artculo es independiente del turno en el que se fabrica (matutino, vespertino, mixto);
si el nivel de ingresos es independiente de la puntualidad o morosidad en los pagos de
crditos.

No debe ignorase que estas pruebas de independencia se realizan con datos agrupados en
tablas de contingencias, como las que se utilizaron para las pruebas sobre proporciones sin
embargo en estas solo haba dos renglones. En tanto que para las pruebas de independencia
el nmero de categoras suele ser de ms de 2 para ambas variables de clasificacin.

El procedimiento de 2 para la bondad de ajuste tambin se puede usar para probar la


hiptesis de independencia de dos variables de clasificacin.

Ejercicios

1. Una empresa de investigacin de mercados desea saber si la marca de ciertos


automviles depende de la zona en la que habitan sus propietarios. Para investigarlo,
toma una muestra aleatoria de 600 propietarios con sus autos e identifica que marca
poseen y en qu zona de la ciudad habitan. En la siguiente tabla se muestran los
resultados. La empresa decide realizar la prueba con un nivel de significacin del 0.01

=
1 =
= 0.01
= 4
2 = 13.277
( 2 13.277| = 4) = 0.01
3.0172 + 2.6160 + 10.5776 = 16.2107

La suma de los cuadrados de las diferencias entre las frecuencias observadas y esperadas, divididas
entre las esperadas da un total de 16.2107 que es el valor calculado del estadstico de prueba 2 . Este
valor calculado es mayor que el valor crtico, 13.277, as que se rechaza la hiptesis nula, y se concluye
que, efectivamente, la marca de auto que poseen los propietarios de automviles de esas ciudad si
depende de la zona en que habitan.

33
2. Se desea probar si el tipo de defecto observado en las unidades producidas en una planta
manufacturera es independiente del turno en el que se fabrican. Se toma una muestra de
productos de los diferentes turnos y se obtienen los siguientes resultados que se
muestran en la tabla:
Pruebe la hiptesis con un nivel de significancia del 0.01

=
1 =
= 0.01
= (4 1)(3 1) = 6
2 = 16.812
( 2 13.277| = 4) = 0.01
3.0172 + 2.6160 + 10.5776 = 16.2107

La suma de los cuadrados de las diferencias entre las frecuencias observadas y esperadas, divididas
entre las esperadas da un total de 12.6069 que es el valor calculado del estadstico de prueba 2 . Este
valor calculado es menor que el valor crtico, 16.2107, as que se acepta la hiptesis nula, y se
concluye que, efectivamente, el tipo de defecto observado en las unidades producidas en una planta
manufacturera es independiente del turno en el que se fabrican.

3. Para saber si la calidad de la educacin primaria depende de la ubicacin de la escuela, se


tom una muestra de escuelas que arrojo los siguientes resultados:
Pruebe la hiptesis de independencia con un nivel de significancia de 0.05

=
1 =
= 0.05
= (3 1)(4 1) = 6
2 = 12.592
( 2 < 13.277| = 4) = 0.05
17.0960 + 12.5480 + 6.6667 = 36.3106

La suma de los cuadrados de las diferencias entre las frecuencias observadas y esperadas, divididas
entre las esperadas da un total de 36.3106 que es el valor calculado del estadstico de prueba 2 . Este
valor calculado es mayor que el valor crtico, 12.592, as que se rechaza la hiptesis nula, y se concluye
que, efectivamente, la calidad de la educacin primaria si depende de la ubicacin de la escuela.

34
4. Una empresa de servicios de capacitacin para empleados de nuevo ingreso de diversas
compaas analiza la posible relacin entre el desempeo de los empleados durante los
cursos de capacitacin y su desempeo en el trabajo. Obtiene una muestra aleatoria de
empleados que ha capacitado y registra los resultados que muestran en la tabla siguiente:
Realice la prueba con un nivel de significancia de 0.01

=
1 =
= 0.01
= (3 1)(3 1) = 4
2 = 13.277
( 2 < 13.277| = 4) = 0.01
6.8689 + 2.0756 + 10.5700 = 19.5145

La suma de los cuadrados de las diferencias entre las frecuencias observadas y esperadas, divididas
entre las esperadas da un total de 19.5145 que es el valor calculado del estadstico de prueba 2 . Este
valor calculado es mayor que el valor crtico, 13.277, as que se rechaza la hiptesis nula, y se concluye
que, efectivamente, el rendimiento en el trabajo si depende del desempeo en la capacitacin.

5. Se analizaron los limones producidos en 4 estados del pas para evaluar si existe relacin entre las
regiones y la calidad de los mismos. Los resultados que se obtuvieron fueron:

La calidad de los limones es independiente del estado donde se cosechan? Realice la prueba con un
nivel de significancia de 0.01

=
1
= 0.01
= (3 1)(4 1) = 6
2 = 16.812
( 2 < 16.812| = 6) = 0.01
412.5991 + 15.6268 + 17.1649 + 1679.1864 = 2124.5772

La suma de los cuadrados de las diferencias entre las frecuencias observadas y esperadas, divididas
entre las esperadas da un total de 2124.5772 que es el valor calculado del estadstico de prueba 2 .
Este valor calculado es mayor que el valor crtico, 16.812, as que se rechaza la hiptesis nula, y se
concluye que, efectivamente, la calidad de los limones si depende del estado donde se cosechan.

35
6. Una empresa de la telefona celular desea saber si el modelo de telfono que prefieren
sus clientes depende de la edad de estos. Para saberlo, toma una muestra aleatoria de
500 compradores, se identifican los modelos y las edades de los clientes. Pruebe si las 2
variables son independientes con un nivel de significancia de 0.05

=
1
= 0.05
= (4 1)(5 1) = 12
2 = 21.026
( 2 < 21.026| = 6) = 0.05
17.8219 + 6 + 20.8106 + 5.5617 + 6.3159 = 56.7035

La suma de los cuadrados de las diferencias entre las frecuencias observadas y esperadas, divididas
entre las esperadas da un total de 56.7035 que es el valor calculado del estadstico de prueba 2 . Este
valor calculado es mayor que el valor crtico, 21.026, as que se rechaza la hiptesis nula, y se concluye
que, efectivamente, el modelo de telfono que prefieren sus clientes si depende de la edad de estos.

7. El director de una aseguradora desea saber si el tipo de seguro depende de los ingresos
del cliente. Para investigarlo, toma una muestra aleatoria de 250 personas e identifica los
tipos de seguros que prefieren y cules son sus ingresos. Pruebe la independencia de
estas 2 variables con un nivel de significancia de 0.10

=
1 =
= 0.10
= (4 1)(3 1) = 6
2 = 10.645
( 2 < 10.645| = 6) = 0.10
3.2966 + 11.0989 + 12.2948 = 26.6903

La suma de los cuadrados de las diferencias entre las frecuencias observadas y esperadas, divididas
entre las esperadas da un total de 26.6903 que es el valor calculado del estadstico de prueba 2 . Este
valor calculado es mayor que el valor crtico, 10.645, as que se rechaza la hiptesis nula, y se concluye
que, efectivamente, el tipo de seguro es independiente de los ingresos del cliente.

36
8. El coordinador de una universidad desea saber si las calificaciones de los alumnos de la
licenciatura a su cargo dependen del gnero de los estudiantes. Para saber esto toma una
muestra de 200 alumnos e identifica las calificaciones de hombres y mujeres. Con un nivel de
significacin de 0.025, Las calificaciones y el gnero son variables independientes?

=
1 =
= 0.025
= (2 1)(2 1) = 1
2 = 5.024
( 2 < 5.024| = 6) = 0.025
2.3094 + 31.0030 = 33.3124

La suma de los cuadrados de las diferencias entre las frecuencias observadas y esperadas, divididas
entre las esperadas da un total de 33.3124 que es el valor calculado del estadstico de prueba 2 . Este
valor calculado es mayor que el valor crtico, 5.024, as que se rechaza la hiptesis nula, y se concluye
que, efectivamente, las calificaciones son dependientes del gnero.

9. Una empresa cervecera desea saber si el tipo de cerveza preferida por sus clientes (ligera,
clara, oscura) depende del gnero del consumidor. Para saber esto, toma una muestra de
150 personas e identifica los tipos de cerveza y si sus consumidores son hombres o
mujeres. Pruebe si el gnero es independiente al tipo de cerveza seleccionada, con un
nivel de significancia del 0.05

=
1 =
= 0.05
= (2 1)(3 1) = 2
2 = 5.991
( 2 < 5.991| = 2) = 0.05
0.1326 + 0.1989 = 0.3314

La suma de los cuadrados de las diferencias entre las frecuencias observadas y esperadas, divididas
entre las esperadas da un total de 0.3314 que es el valor calculado del estadstico de prueba 2 . Este
valor calculado es menor que el valor crtico, 5.991, as que se acepta la hiptesis nula, y se concluye
que, efectivamente, el gnero es independiente al tipo de cerveza seleccionada.

37
10. Una institucin gubernamental desea saber si el desempeo acadmico est relacionado
con el estado nutricional de los nios. Para saber esto, toma una muestra de 300 nios e
identifica cuantas comidas completas ingieren al da y que nivel de desempeo acadmico
mantienen. Pruebe, con un nivel de significacin de 0.005, si el nivel nutricional y el
desempeo acadmico son variables independientes.

=
1 =
= 0.005
= (2 1)(3 1) = 2
2 = 10.597
( 2 < 10.597| = 2) = 0.005
17.2449 + 0.5357 + 16.6234 = 34.4040

La suma de los cuadrados de las diferencias entre las frecuencias observadas y esperadas, divididas
entre las esperadas da un total de 34.4040 que es el valor calculado del estadstico de prueba 2 . Este
valor calculado es mayor que el valor crtico, 10.597, as que se rechaza la hiptesis nula, y se concluye
que, efectivamente, el nivel nutricional es dependiente al desempeo acadmico.

11. Una agencia de publicidad hace un estudio de mercado y desea saber si la proporcin de las
franquicias de comida rpida depende de si son de nios, jvenes y adultos quienes lo consumen.
Pruebe la hiptesis con un nivel de significancia del 5%

= La proporcin de las franquicias de comida rpida depende de la edad


1 = La proporcin de las franquicias de comida rpida es independiente de la edad
= (2 1)(3 1) = 2
(5.991; = 2) = 0.05
( )2
2 = = 54.6368 + 10.5405 + 11.8925 = 77.0068

El valor crtico calculado, 77.0068, es mayor que el valor crtico, 5.991 por lo tanto se rechaza la
hiptesis nula y se concluye; la proporcin de las franquicias de comida rpida es independiente de la
edad.

38
12. En un estudio de mercado realizado por Desint desea probar la hiptesis de que la preferencia de
tomar jugo o soda dependen de la edad del consumidor. Pruebe con un nive de significancia del
5%

= La proporcin de la preferencia de tomar jugo o soda depende de la edad del consumidor


1 = La proporcin de la preferencia de tomar jugo o soda es independiente de la edad del consumidor
= (2 1)(3 1) = 2
(5.991; = 2) = 0.05
( )2
2 = = 28.3128 + 0.0080 + 18.3992 = 46.72

El valor crtico calculado, 46.72, es mayor que el valor crtico, 5.991 por lo tanto se rechaza la hiptesis
nula y se concluye; la proporcin de la preferencia de tomar jugo o soda es independiente de la edad
del consumidor.

13. Con los datos siguientes, pruebe si la puntualidad es independiente de las horas que duermen los
trabajadores con un nivel de significancia del 5%

=
1 =

= (2 1)(3 1) = 2
( 2 5.991; = 2) = 0.05

( )2
2 = = 0.0293 + 3.2059 + 1.3943 = 4.6295

El valor crtico calculado, 4.6295, es menor que el valor crtico, 5.991 por lo tanto se acepta la
hiptesis nula y se concluye la puntualidad es independiente a las hrs que duermen los trabajadores.

39
14. Un doctor desea saber si la proporcin de los hbitos alimenticios es dependiente al peso de sus
pacientes, compruebe con un nivel de significancia del 5%

= La proporcin de los hbitos alimenticios es dependiente al peso de sus pacientes


1 =La proporcin de los hbitos alimenticios es independiente al peso de sus pacientes
= (2 1)(3 1) = 2
( 2 5.991; = 2) = 0.05

( )2
2 = = 0.1736 + 7.3472 + 1.1842 = 8.7050

El valor crtico calculado, 8.7050, es mayor que el valor crtico, 5.991 por lo tanto se rechaza la
hiptesis nula y se concluye la proporcin de los hbitos alimenticios es dependiente al peso de sus
pacientes.

15. Un estudio realizado por la SE quiere probar la hiptesis de que el nivel socioeconmico depende
de la marca de telfono que la poblacin elige, compruebe con un nivel de significancia del 1%

= El nivel socioeconmico depende de la marca de telfono que la poblacin elige


1 =El nivel socioeconmico depende de la marca de telfono que la poblacin elige
= (2 1)(3 1) = 2
( 2 9.210; = 2) = 0.01

( )2
2 = = 10.5195 + 1.0101 + 10.6371 = 22.1667

El valor crtico calculado, 22.1667, es mayor que el valor crtico, 9.9210 por lo tanto se rechaza la
hiptesis nula y se concluye que el nivel socioeconmico depende de la marca de telfono que la
poblacin elige.

40
16. Sephora desea saber si la preferencia del color de los labiales es dependiente a la estacin del ao
con un nivel de significancia del 10%

=
1 =

= (2 1)(3 1) = 2
( 2 4.605; = 2) = 0.1
( )2
2 = = 43.1876 + 2.5521 + 9.7547 = 55.4944

El valor crtico calculado, 55.4944, es mayor que el valor crtico, 4.605 por lo tanto se rechaza la
hiptesis nula y se concluye que la preferencia del color de los labiales es independiente de la
estacin del ao.

17 Se realiz una encuesta para determinar si la edad est relacionada con la opinin de los
ciudadanos sobre el tipo de seguridad social para los trabajadores, y se obtuvieron los
siguientes resultados:

Pruebe si estas 2 variables son independientes con un nivel de significancia de 0.05

=
1 =

= (2 1)(3 1) = 2
( 2 5.991; = 2) = 0.05

( )2
2 = = 0.7856 + 0.4076 + 0.0056 = 1.1988

El valor crtico calculado, 1.1988, es menor que el valor crtico, 5.991 por lo tanto se acepta la
hiptesis nula y se concluye que la edad es independiente de la opinin de los ciudadanos sobre el
tipo de seguridad social.

41
18. Con los datos siguientes, pruebe si el estado civil es independiente de la edad con un nivel de
significancia de 0.05

=
1 =

= (2 1)(3 1) = 2
( 2 5.991; = 2) = 0.05

( )2
2 = = 16.3798 + 0.0447 + 8.9542 = 25.3778

El valor crtico calculado, 25.3778, es mayor que el valor crtico, 5.991 por lo tanto se rechaza la
hiptesis nula y se concluye que el estado civil es dependiente de la edad.

19. Una revista prestigiada quiere probar la hiptesis de que la preferencia del sistema operativo en
los ordenadores depende de la profesin, compruebe con un nivel de significancia de 1%

=
1 =
= (2 1)(3 1) = 2
( 2 9.210; = 2) = 0.01

( )2
2 = = 19.2857 + 89.6296 + 31.2963 = 140.2116

El valor crtico calculado, 140.216, es menor que el valor crtico, 9.210 por lo tanto se acepta la
hiptesis nula y se concluye el sistema operativo del ordenador es independiente de la profesin.

20. Un estudio realizado por la Universidad de Alemania desea probar la hiptesis de que el lugar de
nacimiento depende de si las personas son zurdas o diestras con un nivel de significancia del
0.005

=
1 =
= (2 1)(3 1) = 2
( 2 10.597; = 2) = 0.005

( )2
2 = = 4.8485 + 0 + 5.9259 = 10.7744

42
El valor crtico calculado, 10.7744, es mayor que el valor crtico, 10.597por lo tanto se rechaza la
hiptesis nula y se concluye que el lugar de nacimiento depende de si las personas son zurdas o
diestras.

5.5 Pruebas de contingencia (ji-cuadrada)

En las pruebas de bondad y ajuste que vimos anteriormente, se analizaba nicamente una
variable y un rasgo. Sin embargo, la prueba de ji cuadrada tambin se puede utilizar cuando se
analizan dos rasgos a la vez. En estos casos, se utiliza para saber si existe alguna relacin entre
estos dos rasgos.
La prueba chi-cuadrado de contingencia sirve para comprobar la independencia de frecuencias
entre dos variables aleatorias, X e Y.

Las hiptesis contrastadas en la prueba son:

Hiptesis nula: X e Y son independientes.

Hiptesis alternativa: X e Y no son independientes (No importa cul sea la relacin que
mantengan ni el grado de esta.

La estadstica de prueba adecuada es ji cuadrada que se designa por 2

Para conocer las frecuencias observadas se utiliza la siguiente frmula:

43
Ejercicios
1. El Centro de Readaptacin Social (CERESO) de la ciudad de Tamaulipas, quiere investigar
si es diferente la readaptacin a la vida civil de un hombre liberado de prisin, si regresa a
vivir en su lugar de origen, o si se va vivir a otro lado. Dicho de otra forma, existe alguna
relacin entre la readaptacin a la vida civil y el lugar de residencia despus de haber sido
liberado de prisin? Los psiclogos del CERESO de Tamaulipas entrevistaron a una
muestra aleatoria de 200 prisioneros ya liberados, y con base en los resultados,
clasificaron su readaptacin como excelente, buena, regular e insatisfactoria. En la
siguiente tabla se muestran los resultados obtenidos para esta muestra.

= No hay relacin entre la readaptacin a la vida civil y el lugar en donde vive el individuo despus de haber sido liberado
de prisin.
1 = Hay relacin entre la readaptacin a la vida civil y el lugar en donde vive el individuo despus de haber sido liberado de
prisin.
= 0.01

0.7509 + 1.0012 + 1.4464 + 1.9286 + 1.225 + 1.6333 + 0.4464 + 0.5952 = 9.0291


2 = 9.0291
= (2 1)(4 1) = 3
= 2 = 11.345

Como el valor calculado, 9.0291 es menor al valor crtico, 11.345, se acepta la hiptesis nula y
se concluye que efectivamente, hay relacin entre la readaptacin a la vida civil y el lugar en
donde vive el individuo despus de haber sido liberado de prisin.

44
2. Se desea determinar si las opiniones de los votantes residentes del estado de California
con respecto a una nueva reforma fiscal son independientes a sus niveles de ingreso. Una
muestra aleatoria de 1000 votantes registrados en el estado de California se clasifican de
acuerdo con su posicin en las categoras de ingreso bajo, medio, alto, y si estn a favor o
no de la nueva reforma fiscal. Los datos se representan en la siguientes tabla

= Las opiniones de los votantes residentes del estado de California son independientes a sus niveles de ingreso.
1 = Las opiniones de los votantes residentes del estado de California son dependientes a sus niveles de ingreso
= 0.05
1.7831 + 2.6524 + 0.0458 + 0.0682 + 1.3381 + 1.9905 = 7.8782
2 = 7.8782
= (2 1)(3 1) = 2
= 2 = 7.815

Como el valor calculado, 7.8782 es mayor al valor crtico, 7.815, se rechaza la hiptesis nula y
se concluye que efectivamente, las opiniones de los votantes residentes del estado de
California son dependientes a sus niveles de ingreso.

3. En un experimento para estudiar la dependencia de la hipertensin con respecto a los


hbitos de fumar, se tomaron los siguientes datos de 180 individuos:

Pruebe la hiptesis de que la presencia o ausencia de la hipertensin es independiente de los


hbitos de fumar. Utilice un nivel de significancia de 0.05.

= La hipertensin es dependiente a los hbitos de fumar


1 = La hipertensin es independiente a los hbitos de fumar
= 0.05
4.5734 + 4.2783 + 1.2147 + 1.1364 + 1.6847 + 1.5760 = 14.4636
2 = 14.4636
= (2 1)(3 1) = 2
= 2 = 5.991

Como el valor calculado, 14.4636 es mayor al valor crtico, 5.991, se rechaza la hiptesis nula
y se concluye que efectivamente, la hipertensin es independiente a los hbitos de fumar.

45
4. Una muestra aleatoria de 90 adultos se clasifica de acuerdo con su gnero y el nmero de
horas que pasan viendo la televisin durante una semana:

Utilice un nivel de significancia del 0.01 y pruebe la hiptesis de que el tiempo que pasan
viendo televisin es independiente de si el espectador es hombre o mujer.

= El tiempo que pasan viendo televisin es independiente del sexo del espectador
1 = El tiempo que pasan viendo televisin es dependiente del sexo del espectador
= 0.01
1.4911 + 1.4263 + 1.3047 + 1.2480 = 5.4702
2 = 5.4702
= (2 1)(2 1) = 1
= 2 = 6.635

Como el valor calculado, 5.4702 es menor al valor crtico, 6.635, se acepta la hiptesis nula y
se concluye que efectivamente, el tiempo que pasan viendo la televisin es dependiente del
sexo del espectador.

5. Una muestra aleatoria de 200 hombres casados, todos jubilados, se clasifica de acuerdo
con la educacin y nmero de hijos:

Con un nivel de significancia de del 0.05, pruebe la hiptesis de que el tamao de la familia es
independiente del nivel acadmico del padre.

= El tamao de la familia es independiente del nivel acadmico del padre


1 = El tamao de la familia es dependiente del nivel acadmico del padre
= 0.05
1.1703 + 0.1198 + 1.1853 + 0.2024 + 0.5554 + 0.1580 + 2.3065 + 1.5698 + 0.1969 = 7.6444
2 = 7.6444
= (4 1)(3 1) = 6
= 2 = 12.592

Como el valor calculado, 7.6444 es menor al valor crtico, 12.592, se acepta la hiptesis nula y
se concluye que efectivamente, que el tamao de la familia es dependiente del nivel
acadmico del padre.

46
6. Un criminlogo realizo una investigacin para determinar si, en una ciudad grande, la
incidencia de ciertos tipos de delitos vara de una parte a otra. Los crmenes especficos
de inters son asalto (con violencia), robo en casa, hurto y homicidio. La siguiente tabla
muestra el nmero de delitos cometidos en cuatro reas de la ciudad durante el ao
pasado.

A partir de tales datos podemos concluir, con un nivel de significancia de 0.01, que la
ocurrencia de estos tipos de delitos es dependiente del distrito de la ciudad?

= La ocurrencia de estos tipos de delitos es dependiente del distrito de la ciudad


1 = La ocurrencia de estos tipos de delitos es independiente del distrito de la ciudad
= 0.01
3.1875 + 12.8824 + 3.7607 + 19.6589 + 0.4894 + 14.2987 + 9.6433 + 6.1292 + 1.7868 + 20.3707
+ 7.3055 + 19.8656 + 1.6725 + 0.1607 + 2.4359 + 0.8808 = 124.5297
2 = 124.5297
= (4 1)(4 1) = 9
= 2 = 21.666

Como el valor calculado, 124.5297 es mayor al valor crtico, 21.666, se rechaza la hiptesis
nula y se concluye que efectivamente, la ocurrencia de estos tipos de delitos es
independiente del distrito de la ciudad.

7. El hospital de la universidad realizo un experimento para determinar el grado de alivio


que brindan tres remedios para la tos. Cada medicamento para la tos se trata en 50
estudiantes y se registran los siguientes datos:

Con un nivel de significancia de 0.05, pruebe la hiptesis de que los tres remedios para la tos
igualmente son efectivos.

= Los tres remedios para la tos son igualmente efectivos


1 = Los tres remedios para la tos no son igualmente efectivos
= 0.05
0 + 0.3103 + 0.9 + 0.3636 + 0.0345 + 0.10 + 0.3636 + 0.1379 = 3.81
2 = 3.81
= (3 1)(3 1) = 4
= 2 = 9.488

Como el valor calculado, 3.81 es menor al valor crtico, 9.4888, se acepta la hiptesis nula y se concluye que
efectivamente, los tres remedios para la tos no son igualmente efectivos.

47
8. De acuerdo con un estudio de la Universidad de Johns Hopkins publicado en American
Journal of Public Health, las viudas viven ms que los viudos. Considere los siguientes
datos de supervivencia de 100 viudas y 100 viudos despus de la muerte de su cnyuge:

Con un nivel de significancia de 0.05 podemos concluir que las proporciones de viudas y viudos
son independientes de los aos vividos?
= Las proporciones de viudas y viudos son independientes a los aos vividos
1 = Las proporciones de viudas y viudos son dependientes a los aos vividos
= 0.05
1.5313 + 0.0244 + 8.1667 + 1.5313 + 0.0244 + 1.3333 = 12.6113
2 = 12.6113
= (3 1)(2 1) = 2
= 2 = 5.991

Como el valor calculado, 12.6113 es mayor al valor crtico, 5.991, se rechaza la hiptesis nula y se
concluye que efectivamente, las proporciones de viudas y viudos son dependientes a los aos vividos.

9. Se lleva a cabo una investigacin en dos ciudades de Virginia, para determinar la opinin
de los votantes hacia los candidatos a la gubernatura en una eleccin prxima. En cada
ciudad se seleccionan 500 votantes al azar y se registran los siguientes datos:

Con un nivel de significancia de 0.05, pruebe la hiptesis nula de que la opinin de los
votantes hacia los candidatos depende de la ciudad donde habitan.
= La opinin de los votantes hacia los candidatos depende de la ciudad donde habitan
1 = La opinin de los votantes hacia los candidatos es independiente de la ciudad donde habitan
= 0.05
0.5140 + 0.2066 + 0.1975 + 0.5140 + 0.2066 + 0.1975 = 1.8362
2 = 1.8362
= (3 1)(2 1) = 2
= 2 = 5.991

Como el valor calculado, 1.8363 es menor al valor crtico, 5.991, se acepta la hiptesis nula y se
concluye que efectivamente, la opinin de los votantes hacia los candidatos depende de la ciudad
donde habitan.

48
10. Se lleva a cabo un estudio en Indiana, Kentucky y Ohio, para determinar la postura de los
votantes con respecto al transporte escolar. Una encuesta de 200 votantes cada uno de estos
estados los siguientes resultados:

Con un nivel de significancia de 0.025, pruebe la hiptesis nula de que las proporciones de la
postura de los votantes son independientes de la ciudad donde habitan.

= La postura de los votantes es independiente de la ciudad donde habitan


1 = La postura de los votantes es dependiente de la ciudad donde habitan
= 0.025
1.5319 + 1.7979 + 0.0106 + 4.1013 + 2.1392 + 0.3165 + 1.3333 + 0 + 1.3333 = 12.5641
2 = 12.5641
= (3 1)(3 1) = 4
= 2 = 11.143

Como el valor calculado, 12.5641 es mayor al valor crtico, 11.143, se rechaza la hiptesis nula y se
concluye que efectivamente, la postura de los votantes es dependiente de la ciudad donde habitan.

5.6 Pruebas de bondad de ajuste

Las pruebas de hiptesis estadsticas acerca de parmetros tales como 2 . Existen otras
pruebas para determinar si una poblacin tiene una distribucin terica especfica. Esta
prueba se basa en que tan buen ajuste tenemos entre la frecuencia de ocurrencia de las
observaciones que se obtienen a partir de la distribucin hipottica

Considere el lanzamiento de un dado; El dado se lanza 120 veces y se registra cada resultado,
tericamente si el dado esta balanceado esperamos que cada cara ocurriera 20 veces.
Frecuencia 1 2 3 4 5 6
Observada 20 22 17 18 19 24
Esperada 20 20 20 20 20 20
Al comparar las frecuencias observadas con las frecuencias esperadas correspondientes,
debemos decir que si es posible que tales discrepancias ocurran como resultado de
fluctuaciones del muestreo y de que el dado esta balanceado o que este no es legal, y que la
distribucin de resultados no es uniforme.

( )
2 =

=1

El nmero de grados de libertad que se asocia con la distribucin chi-cuadrada que se utiliza
aqu; hay slo k-1 frecuencias de celdas libremente determinadas.

49
Si en las frecuencias observadas estn cerca de las frecuencias esperadas correspondientes
del valor chi-cuadrada, ser pequeo lo cual indica un buen ajuste. Si las frecuencias
esperadas observadas difieren de manera considerable de las frecuencias esperadas, el valor
chi-cuadrada tendr un ajuste deficiente. Un buen ajuste conduce a la aceptacin de la
hiptesis nula mientras que un ajuste deficiente conduce a su rechazo.

La regin critica en la cola derecha de la distribucin chi-cuadrada para un nivel de


significancia igual a
2 > 2

El criterio de decisin que aqu se describe no se deber utilizar, a menos que cada una de las
frecuencias esperadas sea al menos igual a 5. Esta restriccin podra requerir la combinacin
de celdas adyacentes lo que tiene como resultados una reduccin en el nmero de grados de
libertad.
(20 20)2 (22 20)2 (17 20)2 (18 20)2 (19 20)2 (24 20)2
2 = + + + + +
20 20 20 20 20 20
2
34 17
= = = 1.7
20 10
= 5

Ejercicios
1. Probemos la hiptesis de que la distribucin de frecuencias de las duraciones de bateras
puede aproximarse mediante una distribucin normal con = 3.5 y una desviacin
estndar de 0.7.

( )2 (7 8.582)2 (15 10.176)2 (8 9.672)2


2 = = + +
8.582 10.176 9.672
2 = 2.8911
( 2 > 7.815 , 3) = 0.05

Como el valor chi calculado es menor que nuestra regin critica, no tenemos razn para rechazar la
hiptesis nula y concluimos que la distribucin normal con = 3.5 y = 0.7 brindan un buen ajuste
para la distribucin de duraciones de las bateras.

50
2. En cierta mquina expendedora de refrescos existen 4 canales que expiden el mismo tipo
de bebida. Estamos interesados en averiguar si la seleccin de cualquiera de estos canales
se hace de forma aleatoria o por el contrario existe algn tipo de preferencia en la
seleccin de alguno de ellos por los consumidores. La siguiente tabla muestra el nmero
de bebidas vendidas en cada uno de los 4 canales durante una semana. Contrastar la
hiptesis de que los canales son seleccionados al azar a un nivel de significacin del 5%.

70
= = 17.5
4

( )2 (13 17.5)2 (22 17.5)2 (18 17.5)2 (17 17.5)2


2 = = + + +
17.5 17.5 17.5 17.5
2 = 2.3428
= (4 1) = 3
2 0.05 = 7.815
( 2 < 7.815 | = 3) = 0.05
Puesto que el valor del estadstico de prueba, 2.3438 es menor que el valor crtico, 7.815, se acepta la
hiptesis nula de que los datos se ajustan a una distribucin uniforme. Es decir los canales son
seleccionados aleatoriamente por los consumidores.

Conclusin
Las pruebas de hiptesis con dos muestras y varias muestras con datos categricos tienen
aplicaciones de gran importancia, como la ocurrencia de dos eventos, en la cual se desea
observar si son dependientes o independientes. La distribucin chi cuadrada sirve para todas
las inferencias sobre la varianza de una poblacin. Existen muchos problemas para los cuales
los datos son categorizados y los resultados expuestos en forma de conteos o cuentas, se
pueden aplicar en un conjunto de calificaciones de un examen final puede ser representado
con una distribucin de frecuencias.

Bibliografa
Daz Mata, A. (2013). Estadstica Aplicada a la Administracin y la Economa. Mxico,
D.F: The McGraw Hill.
J. Kazmier, L. (2003). Estadstica Aplicada a la Administracin y a la Economa (3rd ed.,
pp. 133-1661). Mxico, D.F: McGraw-Hill

51

You might also like