You are on page 1of 22

PRUEBAS DE HIPTESIS

72

CAPTULO 4 PRUEBAS DE HIPTESIS


4.1 Introduccin.
Existen mltiples problemas en los cuales, en vez de estimar el valor de un parmetro, se debe decidir si una afirmacin relativa a un parmetro es verdadera o falsa; esto es, se debe probar una hiptesis relativa a un parmetro.

4.2 Errores tipo I y tipo II.


Para ilustrar los conceptos generales relacionados con este tipo de problemas de decisin (pruebas de hiptesis), supngase que una agencia de proteccin al consumidor desea probar la afirmacin de un fabricante de pinturas segn la cual el tiempo promedio de secado de su nueva pintura de secado rpido es de 20 minutos. As que gira instrucciones a un miembro de su equipo de investigacin para que pinte 36 tableros con el contenido de 36 diferentes botes de 1 galn de la pintura, a fin de rechazar la afirmacin, cuando la media de los tiempos de secado sea mayor a 20.75 minutos; de otra manera, aceptar la afirmacin y en cualquier caso tomara las medidas correspondientes. Lo anterior proporciona un criterio bien definido para aceptar o rechazar la afirmacin, pero desafortunadamente no es infalible. Puesto que la decisin se basa en una muestra, existe la posibilidad de que: 1. La media muestral exceda 20.75 y la media real de secado sea = 20 2. La media muestral sea 20.75 o ms pequea y que la media real sea mayor, digamos = 21 Ambos casos generaran una decisin incorrecta. Se analizan estas posibilidades. Supngase que por experiencia se sabe que = 2.4 minutos de secado. 1. Determinar P ( x > 20.75 ) , esto es, el procedimiento no logra detectar que = 20 Datos: = 2.4 , n = 36 2 .4 x = 20 x = = 0.4 36 (20.75 20) = 1.875 y P ( x > 20.75 ) = P ( z > 1.875) 0.0304 de donde: z = 0.4

PRUEBAS DE HIPTESIS

73

Grficamente: se acepta la afirmacin de que = 20 se rechaza la afirmacin de que = 20

0.0304

= 20

x
20.75

Conclusin : la probabilidad de rechazar errneamente la hiptesis de que el tiempo promedio de secado de la pintura est dado por: =20 minutos es aproximadamente 0.0304 2.- Determinar ahora la posibilidad de que el procedimiento no logre detectar que el tiempo promedio de secado sea diferente a 20 minutos; suponiendo que =21, calculamos P ( x < 20.75 ) Se estara aceptando errneamente la afirmacin de que = 20 Con: = 2.4 n = 36 2.4 x = 21 x = = 0.4 36 (20.75 21) z= = 0.625 y P ( x < 20.75 ) = P ( z < 0.625) 0.2660 0.4 Se rechaza la afirmacin de que =20 ,

Grficamente: Se acepta la afirmacin de que =20

0.2660

x = 21 20.75 Conclusin : nos equivocamos al aceptar la hiptesis de que el tiempo promedio de secado de la pintura est dado por =20 con una probabilidad de 0.2660

PRUEBAS DE HIPTESIS

74

La descripcin del ejercicio anterior caracteriza una prueba de una hiptesis estadstica. Llamando H a las hiptesis que estn siendo probadas. Se resume: Se acepta H H es verdadera H es falsa Decisin Correcta Error Tipo II () Se rechaza H Error Tipo I () Decisin Correcta

Al error tipo I tambin se le llama nivel de significancia. De nuestro ejemplo tenemos que = 0.0304 y = 0.2660 cuando = 21 Resumiendo: el error tipo I es la probabilidad de rechazar la hiptesis cuando sta es verdadera y el error tipo II es la probabilidad de aceptar la hiptesis cuando sta es falsa. Se plante una hiptesis simple del parmetro esto es, se formula de manera que fue especificada por completo; = 20 minutos, en nuestro ejemplo. Una hiptesis denominada compuesta acerca del parmetro podra ser de la forma 20 minutos, puede tomar ms de un valor y no se podra calcular en este caso la probabilidad de cometer un error tipo I. Estudiaremos solamente hiptesis de tipo simple. Cuando, por ejemplo, queremos probar que un mtodo de enseanza es mejor que otro formulamos la hiptesis de que los dos mtodos son iguales de buenos. A ste tipo de hiptesis se les denomina hiptesis nulas y se denotan por Ho. El trmino hiptesis nula se utiliza principalmente para designar cualquier hiptesis formulada para ver si puede ser rechazada. El rechazo de una hiptesis nula Ho conduce a aceptar una hiptesis alterna denotada por H1. Estadsticamente, siempre se har mas nfasis en el error tipo I que en el error tipo II. Es ms, preferentemente se prefiere escribir no se puede rechazar Ho en lugar de escribir se acepta Ho. Tambin, no se debe hacer que la probabilidad de incurrir en un error tipo I sea demasiado pequea, debido a que esto tendera a hacer demasiado grandes las probabilidades de cometer un error tipo II. Los conceptos que se han expuesto se aplican por igual a las hiptesis relativas a proporciones, desviaciones estndar, la aleatoridad de muestras y relaciones entre variables.

PRUEBAS DE HIPTESIS

75

A una prueba de cualquier hiptesis estadstica, en la que la hiptesis alterna es unilateral, tal que: Ho : = o Ho : = o .-parmetro poblacinal H1 : > o o bien H1 : < o o.- valor asignado a se le denomina prueba de una cola o unilateral. A una prueba de cualquier hiptesis estadstica, en la que la hiptesis alterna es bilateral, tal que : Ho : = o H1 : o se le denomina prueba de dos colas o bilateral.

4.3 Potencia de la prueba.


La potencia de la prueba se refiere a la probabilidad de rechazar una hiptesis nula (en forma correcta ) dado un valor alternativo especfico para el parmetro. La potencia de una prueba estadstica es la probabilidad de rechazar la hiptesis nula Ho cuando la hiptesis alternativa es verdadera. Por la tanto, el valor de la potencia est dado por la expresin 1 - , y la potencia puede interpretarse como la probabilidad de rechazar de manera correcta una hiptesis nula falsa. La potencia es una medida descriptiva y concisa de la sensibilidad de una prueba estadstica, donde por sensibilidad se entiende la capacidad de una prueba para detectar diferencias. Si se piensa que el valor de esta potencia es bajo, entonces el analista puede aumentar o el tamao de la muestra. Se anotan algunas observaciones importantes: - La probabilidad de cometer un error tipo I, siempre puede reducirse mediante una seleccin apropiada de los valores crticos. - Los errores tipo I y II estn relacionados. Una disminucin en la probabilidad en un tipo de error siempre da como resultado un aumento en la probabilidad del otro, siempre que el tamao de la muestra n no cambie. - En general, un aumento en el tamao de la muestra reduce tanto a como a , siempre y cuando los valores crticos se mantengan constantes. En general, el analista controla la probabilidad de error tipo I cuando escoge los valores crticos. As usualmente es ms fcil para el analista fijar la probabilidad del error tipo I en (casi) cualquier valor deseado. Puesto que el analista puede controlar de manera directa la probabilidad de rechazar de manera errnea Ho, siempre puede considerarse el rechazo de la hiptesis nula Ho como una conclusin fuerte. Por otra parte, la probabilidad del error tipo II es una funcin tanto del tamao de la muestra que se haya seleccionado como del punto en el cual la hiptesis nula Ho es falsa, es costumbre considerar la decisin de aceptar Ho como una

PRUEBAS DE HIPTESIS

76

conclusin dbil, a menos que se sepa que es aceptablemente pequeo. Por consiguiente, ms que decir se acepta Ho, se prefiere la terminologa no se puede rechazar Ho. La incapacidad de rechazar Ho implica que no se ha encontrado evidencia suficiente para rechazar Ho, esto es, para hacer una proposicin fuerte.

4.4 Formulacin de hiptesis estadstica.


Para probar hiptesis relativas al parmetro de una poblacin de manera sistemtica se anotan las siguientes etapas: 1.- Formular una hiptesis nula simple y una hiptesis alterna apropiada que aceptamos cuando la hiptesis nula debe ser rechazada. H0 : = o H1 : las alternativas pueden ser > o ; < o ; o 2.- Especificar la probabilidad de incurrir en un error tipo I o nivel significancia. de

3.- Con base en la distribucin muestral del estadstico apropiado, considerando H1 y el nivel de significancia , construir grficamente un criterio para probar la hiptesis nula contra la hiptesis alterna determinada. 4.- Calcular el valor del estadstico partiendo de una muestra aleatoria de tamao n. Rechazar Ho si el estadstico tiene un valor en la regin critica, si no es as, acepte Ho. 5.- Escribir la conclusin de acuerdo al planteamiento del problema. La aplicacin de la formulacin de una hiptesis estadstica se describe en el siguiente apartado.

PRUEBAS DE HIPTESIS

77

4.5 Prueba de hiptesis para la media.


Los captulos anteriores nos dan las bases para determinar cuando utilizar cada uno de los siguientes estadsticos: (x ) n (x ) t= n s Z= (4.1) (4.2)

Ejemplo 4.5.1 La altura promedio de las mujeres en el grupo de primer ao de una institucin de enseanza superior es de 162.5 cm. con una desviacin estndar de 6.8 cm. Al nivel de significacin de 0.05, hay alguna razn para creer que existe un cambio en la altura promedio, si una muestra aleatoria de 50 mujeres del grupo actual tiene una altura promedio de 165.2 cm.? Antes de la formulacin de la prueba de hiptesis, por supuesto, se tiene que identificar sobre que parmetro poblacional se har dicha formulacin. En este ejemplo se pide probar si ha existido un cambio en la altura promedio de las mujeres que ha sido de 162.5 cm., es decir se trabajar sobre el parmetro . Adems identificamos: = 6.8, x = 165.2 , n = 50, = 162.5, = 0.05 Iniciemos: Etapa 1. H0: = 162.5 H1: 162.5 Etapa 2. Etapa 3. Por los datos dados en ste ejemplo se trabaja con el estadstico z, y H1 nos indica que el valor de puede ser mayor o menor a 162.5 por lo que el nivel de significancia para este ejemplo 0.05 se reparte en ambos extremos de la distribucin de z, es decir 0.025 de rea en cada extremo de la grfica.
Zona o regin de rechazo de que = 162.5 Zona o regin de aceptacin de que = 162.5 Zona o regin de rechazo de que = 162.5

= 0.05

- 1.96

1.96

Z
Valor crtico

Etapa 4.

Valor crtico

PRUEBAS DE HIPTESIS

78

Clculos. Utilizando (4.1) Z= (x ) (165.2 162.5) n= 50 = 2.808 6.8

2.808 > 1.96 El valor calculado queda en la regin crtica o regin de rechazo. Entonces: H0 se rechaza y en consecuencia H1 se acepta. Etapa 5. Conclusin: Si existe razn para creer que se ha dado un cambio en la estatura promedio de las mujeres de primer ao de esa institucin de enseanza superior. Ejemplo 4.5.2 El rendimiento promedio de cerezas en un huerto ha sido igual ha 4.35 toneladas por acre durante los ltimos aos. Se prob un fertilizante nuevo en 12 parcelas de un acre seleccionados aleatoriamente. Los rendimientos de las parcelas fueron: 5.00 4.88 4.93 4.92 4.25 4.45 5.35 4.81 3.48 4.45 4.72 4.79 Se tiene evidencia suficiente al nivel de significacin de 0.05 para afirmar que hubo un incremento significativo en la produccin promedio? Datos del problema: x = 4.67 , n = 12, Etapa 1. H0: = 43.5 H1: > 4.35 Etapa 2. Etapa 3. Por los datos dados en ste ejemplo se trabaja con el estadstico t, y H1 nos indica que el valor de sea mayor a 4.35 por lo que el nivel de significancia para este ejemplo 0.05 se dibuja solamente en el lado derecho de la distribucin de t. = 0.05 s = 0.474, = 4.35 , = 0.05

Zona o regin de aceptacin de que = 4.35

Zona o regin de rechazo de que = 4.35

Etapa 4.

1.796

t
Valor crtico

PRUEBAS DE HIPTESIS

79

Clculos. Utilizando (4.2) t= (x ) (4.67 4.35) n= 12 = 2.339 s 0.474

2.339 > 1.796 El valor calculado queda en la regin crtica o regin de rechazo. Entonces: H0 se rechaza y en consecuencia H1 se acepta. Etapa 5. Conclusin: Si se tiene evidencia suficiente al nivel de significacin de 0.05 para afirmar que hubo un incremento significativo en la produccin promedio de cerezas.

4.6 Prueba de hiptesis para la diferencia de medias.


Se tienen los siguientes casos: 4.6.1 Prueba de Hiptesis Para Una Diferencia De Medias (muestras grandes). Existen problemas en los que debemos decidir si una diferencia observada entre dos medias muestrales se puede atribuir al azar. El mtodo que usamos para probar si una diferencia observada entre dos medias es estadsticamente importante se basa en si x 1 y x 2 son las medias de dos muestras aleatorias independientes grandes de tamaos n1 y n2, la distribucin de muestreo de la estadstica x 1 x 2 se puede calcular muy aproximadamente con una curva normal que tenga: 2 12 2 x1 x2 = 1 2 y desviacin estndar x x = + como media 1 2 n1 n2
2 en donde 1 , 2 , 12 , 2 son, respectivamente, las medias y varianzas de las poblaciones de las cuales provienen las muestras. Para muestras grandes podemos basar la hiptesis nula H 0 : 1 2 = ( delta, es el valor de la diferencia entre las medias) en el estadstico:

z=

[( x

y x 2 ) ( 1 2 ) ]
2 12 2 + n1 n2

(4.3)

El cual es el valor de una variable aleatoria distribuida en forma aproximadamente normal

PRUEBAS DE HIPTESIS

80

Para realizar la prueba se siguen en forma semejante las etapas para la formulacin de la prueba de hiptesis. Ejemplo 4.6.1.1 El estroncio 90 es un elemento radioactivo que se produce en las pruebas nucleares y guarda relacin estrecha con el calcio. En granjas lecheras, dicho elemento puede llegar a la leche de vaca por el pasto que comen estos animales. Luego, se concentra en los huesos de las personas que beben la leche. Se realiz un estudio de comparacin de la concentracin media de estroncio 90 en los huesos de nios y adultos. Se pens que los valores en nios fueron ms altos por la presencia del elemento durante sus aos de formacin. Suponiendo normalidad en las observaciones, con un nivel de significancia del 5% y los siguientes datos, prueba la hiptesis planteada. n x S2 Nios 121 2.6 pico curies por gramo 1.44 Adultos 61 1.2 pico curies por gramo 0.021 Etapa 1. H0: n = a H1: n > a Etapa 2. = 0.05 Etapa 3. Por los datos dados en ste ejemplo se trabaja con el estadstico z , y H1 nos indica que el valor de n sea mayor que a por lo que el nivel de significancia para este ejemplo 0.05 se dibuja solamente en el lado derecho de la distribucin de z.
Zona o regin de rechazo de que

Zona o regin de aceptacin de que n = a

n = a

1.645

z
Valor crtico

Etapa 4. Clculos. Muchos investigadores concuerdan en que las varianzas de las muestras se pueden utilizar en la frmula (4.3) en lugar de varianzas

PRUEBAS DE HIPTESIS

81

poblacionales, cuando se desconocen las varianzas poblacionales y los tamaos de muestra son grandes (n1,n2 30), porque con tamaos de la muestra grandes las varianzas son buenas aproximaciones de las varianzas poblacionales.

z=

[( x

x 2 ) ( 1 2 ) ]
2 12 2 + n1 n2

[ (2.6 1.2) (0)] = 12.65


1.44 0.021 + 121 61

12.65 > 1.645 El valor calculado queda en la regin crtica o regin de rechazo. Entonces: H0 se rechaza y en consecuencia H1 se acepta. Etapa 5. Conclusin: Se tiene evidencia al nivel de significacin de 0.05 para afirmar que la presencia del elemento, estroncio 90, en nios es ms alto que en los adultos. 4.6.2 Prueba de Hiptesis Para Una Diferencia De Medias (Muestras 2 pequeas n1+ n2 2 < 30; 12 = 2 pero desconocidas). Se tienen otros casos donde slo se dispone de muestras pequeas para comparar dos medias, entonces nos basamos en la estadstica de t. Debemos suponer que extraemos dos muestras aleatorias independientes de dos poblaciones que aproximadamente tienen la forma de distribuciones normales, y en donde adems 1 = 2 .Entonces podemos basar la hiptesis nula H0: 1 2 = en el estadstico

t= Donde:

[( x

x 2 ) ( 1 2 ) ] 1 1 Sp + n1 n2

(4.4)

Sp = con

(n1 1) S12 + ( n2 1) S 22 n1 + n 2 2 = n1 + n2 2 grados de libertad

(4.5)

La prueba t de dos muestras se usa principalmente para probar la hiptesis nula de que no hay diferencia entre las medias Ho : 1 2 = = 0

PRUEBAS DE HIPTESIS

82

Para aplicar la prueba, se siguen pasos semejantes a los aplicados a una prueba de hiptesis para una muestra. Ejercicio 4.6.2.1 Durante un eclipse solar, la temperatura desciende rpidamente conforme la Luna se interpone entre la Tierra y el Sol. Se obtienen los datos siguientes sobre la cada de temperatura, en grados Fahrenheit, en dos tipos de terrenos del sur de frica durante el eclipse de junio de 2001: Terreno montaoso (TM) 15 12 16 16 13 15 11 19 15 Terreno ribereo (TR) 13 17 19 16 15 19 18 20 21 22 24 Suponiendo que las observaciones se distribuyen en forma aproximadamente normal y que las varianzas poblacionales son iguales pero desconocidas, hay evidencia a un nivel de siginificancia de 2% de que existe diferencia en las temperaturas promedio de la cada de temperatura observada en esos dos terrenos? Etapa 1. H0: TM = TR H1: TM TR Etapa 2. = 0.02 Etapa 3. Por los datos dados en ste ejemplo se trabaja con el estadstico T de la frmula (4.4) y H1 nos indica que el valor de TM sea diferente que TR por lo que el nivel de significancia 0.02 se dibuja y reparte a ambos lados de distribucin de t.
Zona o regin de rechazo de que Zona o regin de aceptacin de que Zona o regin de rechazo de que

TM = TR

TM = TR

TM = TR

- 2.552 Valor crtico

2.552

t
Valor crtico

= n1 + n2 - 2= 9 + 11 2 = 18 t0.01,18 = 2.552 Etapa 4. Clculos. Se ocupa (4.4), por los datos dados en el enunciado del problema. Procesando los datos se tiene:

PRUEBAS DE HIPTESIS

83

nTM = 9 nTR = 11

x = 14.67 x = 18.55

S TM = 2.398 S TM = 3.205

2 S TM = 5.75 2 S TM = 10.273

Utilizando (4.5) S p =

2 (n1 1) S12 + (n 2 1) S 2 = n1 + n2 2

(9 1)(5.75) + (11 1)(10.273) = 2.875 9 + 11 2

As, entonces: t=

[( x

x 2 ) ( 1 2 )] [ (14.67 18.55) (0)] = = 3.003 1 1 1 1 Sp + 2.875 + n1 n2 9 11

-3.003 < -2.552 El valor calculado queda en la regin crtica o regin de rechazo. Entonces: H0 se rechaza y H1 se acepta. Etapa 5. Conclusin: Se tiene evidencia al nivel de significancia de 0.02 para afirmar que existe diferencia en las temperaturas promedio de la cada de temperatura observada en esos dos terrenos. 4.6.3 Prueba de Hiptesis Para Una Diferencia De Media (muestras pequeas; 2 con 12 2 y desconocidas). El estadstico de prueba esta dado por: t=

[( x

x 2 ) ( 1 2 ) ]
2 s12 s 2 + n1 n2

(4.6)

y los grados de libertad se calculan con la frmula


2 s12 s 2 + n 1 n2 2

2 2 2 (4.7) s12 s2 n 1 + n2 (n1 1) (n2 1) Ejercicio 4.6.3.1 Un fabricante de componentes de direcciones hidrulicas compra sellos hidrulicos a dos proveedores. Se seleccionan muestras de los sellos de esos dos proveedores y cada una se prueba para determinar la presin que soporta. Los datos resultantes son los que siguen:

PRUEBAS DE HIPTESIS

84

Proveedor I Proveedor II

n1 = 10 n 2 = 12

x1 = 1350 lb / p lg 2 x 2 = 1338 lb / p lg 2

S12 = 100 S12 = 29

Si se supone que los valores de presin que soportan los sellos hidrulicos son variables aleatorias independientes distribuidos normalmente con varianzas diferentes, puede concluirse que existe alguna diferencia en las presiones promedio que soportan los sellos hidrulicos? Utilizar = 0.05 Etapa 1. H0: 1 = 2 H1: 1 2 Etapa 2. Etapa 3. Por el enunciado del problema se trabaja con el estadstico T de la frmula (4.6) y H1 nos indica que el valor de 1 sea diferente que 2 por lo que el nivel de significancia 0.05 se dibuja y reparte a ambos lados de distribucin de t. Se utiliza (4.7) para determinar los grados de libertad. 100 29 + 10 12 = = = 13.243 se toma = 13 2 2 2 2 2 s12 s2 100 29 n n 10 + 12 1 + 2 ( n1 1) (n2 1) (10 1) (12 1)
Zona o regin de rechazo de que Zona o regin de aceptacin de que Zona o regin de rechazo de que
2 s12 s 2 + n 1 n2 2 2

= 0.05

1 = 2

1 = 2

1 = 2

- 2.16 Valor crtico

2.16

t
Valor crtico

t0.025,13 = 2.16

Etapa 4. Clculos. Se ocupa (4.6), por los datos dados en el enunciado del problema.

PRUEBAS DE HIPTESIS

85

Entonces: t=

[( x

x 2 ) ( 1 2 ) ] s s + n1 n2
2 1 2 2

[ (1350 1338) (0)] = 3.405


100 29 + 10 12

3.405 > 2.16 El valor calculado queda en la regin crtica o regin de rechazo. Entonces: H0 se rechaza y H1 se acepta. Etapa 5. Conclusin: Se tiene evidencia al nivel de significancia de 0.05 para concluir que existe diferencia en las presiones promedio que soportan los sellos hidrulicos comprados a los dos proveedores. 4.6.4 Prueba de Hiptesis Para Una Diferencia De Medias. (observaciones pareadas) Esta prueba aparece cuando, por ejemplo, comparamos los pesos de las personas antes y despus de un tratamiento para bajar de peso. La aplicacin de esta prueba requiere que las unidades que formen la pareja tengan las mismas caractersticas como sucede en los casos siguientes: - Los mismos individuos reciben el tratamiento antes y despus - Las parejas son gemelos que reciben tratamientos diferentes - Dos partes del mismo material son sometidos a tratamientos distintos Estadstico de prueba: t= d ( 1 2 ) n Sd (4.8)

n .- nmero de observaciones pareadas; = n 1 grados de libertad d y S d son el promedio y la desviacin estndar de las diferencias de las observaciones pareadas. Las regiones crticas para las hiptesis alternativas apropiadas se establecen utilizando puntos crticos de la distribucin t de Student

Ejemplo 4.6.4.1 Cinco personas con exceso de peso se pusieron a dieta durante tres meses. Fueron observados sus pesos al comienzo y final de la dieta. Estos datos se muestran en la tabla que sigue: Individuo 1 2 3 4 5

PRUEBAS DE HIPTESIS

86

Peso inicial (I) Peso final (F)

295 251

305 259

323 267

299 265

310 263

Se puede concluir segn estos datos que la dieta es efectiva? Tome = 10% Etapa 1. H0: I = F H1: I > F Etapa 2. = 0.10 Etapa 3. Adems de que los datos se presentan pareados observamos que cada dato, en cada par, depende del otro (el peso final depende del peso inicial). Por lo que ocupamos la frmula (4.8). En esta frmula tenemos d que es el promedio de las diferencias de los pares de datos, por lo que: Peso inicial (I) Peso final (F) Diferencia 295 251 44 305 259 46 323 267 52 299 265 34 310 263 47

y con estas diferencias se calcula d y S d

d = 44.6 y S d = 6.618 Grados de libertad = n 1 = 5 1 = 4


Zona o regin de aceptacin de que I = F Zona o regin de rechazo de que

I = F

1.533

t
Valor crtico

t0.10,4 = 1.533

Etapa 4. Clculos. Utilizando (4.8)

PRUEBAS DE HIPTESIS

87

t=

44.6 (0) 5 = 15.069 6.618

15.069 > 1.533 El valor calculado queda en la regin crtica o regin de rechazo. Entonces: H0 se rechaza y en consecuencia H1 se acepta. Etapa 5. Conclusin: Segn los datos recopilados, la dieta si es efectiva.

4.7 Prueba de hiptesis para la proporcin.


Para la formulacin de una prueba de hiptesis cuando el parmetro a probar es la proporcin p (o parmetro binomial), se puede ocupar como estadstico para dicha prueba, la siguiente frmula: ( x n. p ) z= (4.9) n. p.q donde: n.- tamao de la muestra x.- nmero de xitos p.- proporcin poblacional q = 1- p

Ejemplo 4.7.1 Si 6 de 20 pacientes sufrieron efectos secundarios a causa de un nuevo medicamento, prueba la hiptesis nula P = 0.5 contra la alternativa P 0.5 en el nivel 0.01 de significancia. P es la proporcin verdadera de pacientes que sufren efectos secundarios serios a causa del nuevo medicamento. Se tiene: Etapa 1. H0: p = 0.5 H1: p 0.5 Etapa 2. = 0.01 n = 20, x=6 p = 0.5, q = 0.5 = 0.01

Etapa 3. Por los datos dados en ste ejemplo se trabaja con el estadstico z, y H1 nos indica que el valor de p puede ser mayor o menor a 0.5 por lo que el

PRUEBAS DE HIPTESIS

88

nivel de significancia para este ejemplo 0.01 se reparte en ambos extremos de la distribucin de z, es decir 0.005 de rea en cada extremo de la grfica.
Zona o regin de rechazo de que p = 0.5 Zona o regin de aceptacin de que p = 0.5 Zona o regin de rechazo de que p = 0.5

- 2.575 Valor crtico

2.575

Z
Valor crtico

Etapa 4. Clculos z= ( x n. p ) n. p.q = 6 (20)(0.5) (20)(0.5)(0.5) = 1.789

-1.789 > -2.575 El valor calculado queda en la regin de aceptacin. Entonces: H0 no se puede rechazar y en consecuencia H1 se rechaza. Etapa 5. Conclusin: La proporcin de pacientes que sufrieron efectos secundarios a causa de un nuevo medicamento no se puede indicar que no sea de 0.5.

4.8 Prueba de hiptesis para la diferencia de proporciones.

PRUEBAS DE HIPTESIS

89

Con frecuencia surgen situaciones en donde se desea probar la hiptesis de que dos proporciones son iguales. Por ejemplo, una persona puede dejar de fumar slo si se convence de que la proporcin de fumadores con cncer pulmonar excede la proporcin de no fumadores que padecen del mismo problema. En general, se desea probar la hiptesis nula de que dos proporciones, o parmetros binomiales, son iguales. Esto es, est probndose que p1 = p2 en contraposicin a las alternativas p1 < p2, p1 > p2 p1 p2. El estadstico sobre el cual se basa la decisin es la variable aleatoria p 1 p 2 , el cual se distribuye en forma aproximadamente normal. Se seleccionan al azar muestras independientes de tamaos n1 y n 2 de dos poblaciones x1 x y p 2 = 2 para ambas binomiales y se calculan las proporciones de xito p 1 = n1 n2 muestras. Tambin se calcula una estimacin de la proporcin combinada: x + x2 P= 1 y Q=1-P (4.10) n1 + n 2 Donde x1 y x2 son el nmero de xitos en cada una de las dos muestras. El valor de z para probar Ho : P1 = P2

queda dado por:

Z=

( p1 p 2 ) 1 1 PQ + n n 2 1 (4.11)

Las regiones crticas para las hiptesis alternativas apropiadas se establecen utilizando puntos crticos de la curva normal estndar

Ejemplo 4.8.1 En un estudio para estimar la proporcin de residentes de una ciudad y sus suburbios que estn de acuerdo con la construccin de una planta de energa nuclear, se encontr que 38 de 100 residentes urbanos no favorecen la construccin mientras que 58 de 125 residentes suburbanos se oponen Existe alguna diferencia significativa entre las proporciones de residentes urbanos y suburbanos que favorecen la construccin de la planta nuclear? = 0.05 Residentes urbanos RU; residentes suburbanos SU

PRUEBAS DE HIPTESIS

90

Etapa 1. H0: PRU = PSU H1: PRU PSU Etapa 2. = 0.05 Etapa 3. Por los datos dados en ste ejemplo se trabaja con (4.11). H1 nos indica que el valor de PRU puede ser mayor o menor que PSU por lo que el nivel de significancia 0.05 se reparte en ambos extremos de la distribucin de z, es decir 0.025 de rea en cada extremo de la grfica.
Zona o regin de rechazo de que Zona o regin de aceptacin de que Zona o regin de rechazo de que

PRU = PSU

PRU = PSU

PRU = PSU

- 1.96 Valor crtico

1.96

Z
Valor crtico

Etapa 4. Clculos x1 x y p 2 = 2 en las muestras. n1 n2 Se define el xito x como los residentes que favorecen la construccin de la planta nuclear. As: 62 67 n RU = 100 x RU = 62 p RU = = 0.62 y n SU = 125 x SU = 67 p SU = = 0.536 100 125 Determinamos las proporciones de xito p 1 =

Tambin se requiere de la estimacin de la proporcin combinada: x + x2 62 + 67 P= 1 = = 0.573 y Q = 1 0.573 = 0.427 n1 + n 2 100 + 125 Se puede aplicar ya la frmula (4.11)

PRUEBAS DE HIPTESIS

91

Z=

( p1 p 2 ) 1 1 PQ + n n 2 1

(0.62 0.536) 1 1 (0.573)(0.427 ) + 100 125

= 1.266

1.266 < 1.96 El valor calculado queda en la regin de aceptacin por lo que H 0 no se puede rechazar, se acepta, y entonces H1 se rechaza. Etapa 5. Conclusin: No se puede concluir que exista alguna diferencia significativa entre las proporciones de residentes urbanos y suburbanos que favorecen la construccin de la planta nuclear.

4.9 Prueba de hiptesis para la varianza.


Para la formulacin de una prueba de hiptesis cuando el parmetro a probar es la varianza 2, se ocupa como estadstico para dicha prueba: (n 1) S 2 = 2
2

(4.12)

Las regiones crticas para las hiptesis alternativas apropiadas se establecen utilizando puntos crticos de la distribucin chi-cuadrada. Ejemplo 4.9.1 Se sabe que el contenido de nicotina de una marca de cigarrillos tiene distribucin normal con varianza de 1.3 miligramos. Pruebe la hiptesis de que 2 = 1.3 , si una muestra aleatoria de 8 de estos cigarrillos tiene una desviacin estndar S = 1.8. Use = 5% Etapa 1.
2 H0: = 1.3 2 H1: 1.3

Etapa 2. = 0.05

PRUEBAS DE HIPTESIS

92

Etapa 3. Por los datos dados en ste ejemplo se trabaja con el estadstico 2 S Se acepta que S Se rechaza que

3.28

2
Valor crtico

2 0.05,7 = 14.1

Etapa 4. Clculos. Utilizando (4.12) (n 1) S 2 (8 1)(1.8 2 ) = = 17.446 1.3 2

2 =

17.446 > 14.1 El valor calculado queda en la regin crtica o regin de rechazo. Entonces: H0 se rechaza y en consecuencia H1 se acepta. Etapa 5. Conclusin: Se rechaza la hiptesis de que la varianza del contenido de nicotina de esos cigarrillos sea igual a 1.3

4.10 Prueba de hiptesis para la relacin de varianzas.


2 Consideremos el querer probar la igualdad de las varianzas 12 y 2 de dos 2 poblaciones. Esto es, debe probarse la hiptesis nula H0 de que 12 = 2 en contraposicin de una de las alternativas conocidas. Para muestras aleatorias independientes de tamaos n1 y n2, tomadas de dos poblaciones, el estadstico para la prueba es:

f =

S12 2 S2

(4.13)

2 donde S12 y S 2 son las varianzas calculadas a partir de las dos muestras, de las dos poblaciones en estudio.

PRUEBAS DE HIPTESIS

93

Ejemplo 4.10.1 Se compar la eficiencia de dos tipos de aceites para evitar el desgaste en ciertas piezas sometidas a intenso trabajo. En trece piezas se utiliz el aceite 1 y en otras trece el aceite 2. Las varianzas muestrales fueron 2 S12 = 64, S 2 = 16 . Pruebe la hiptesis nula segn la cual las varianzas de las dos poblaciones son iguales. Considere = 5% Etapa 1. H0: 12 = 2 2 12 2 H1: 2 Etapa 2. = 0.05 Etapa 3. Por los datos dados en ste ejemplo se trabaja con el estadstico f S Se rechaza que S Se acepta que S Se rechaza que

f
0 Valor crtico 0.3049 3.28 Valor crtico

f0.025(12,12)= 3.28 0.975(12,12)= 0.3049

Etapa 4. Clculos. Utilizando (4.13) S12 64 f = 2 = =4 S 2 16 4.0 > 3.28 El valor calculado queda en la regin crtica o regin de rechazo. Entonces: H0 se rechaza y en consecuencia H1 se acepta. Etapa 5. Conclusin: Se rechaza la hiptesis de que las varianzas de las dos poblaciones son iguales.

You might also like