You are on page 1of 37

Universidad Panamericana

Estadstica II
Prof. Andrs Sandoval H

Estadstica II
4. COMPROBACIN DE HIPTESIS
4.1. Definiciones, hiptesis nula, hiptesis alternativa, error tipo I,
error
tipo II,
nivel
de
significacin,
curva
operativa
caracterstica, potencia de una prueba, diferentes tipos de prueba
En los temas anteriores iniciamos el estudio de la inferencia estadstica.
Describimos la forma de seleccionar una muestra aleatoria y, con base en sta,
estimar el valor de un parmetro de la poblacin. En este tema continuaremos con
el estudio de la inferencia estadstica. Sin embargo, en lugar de calcular un rango
de valores dentro del cual se espera que se encuentre el parmetro de la
poblacin, se realizar una prueba de hiptesis acerca de una afirmacin sobre un
parmetro de la poblacin. Algunos ejemplos de afirmaciones que se podran
probar utilizando pruebas de hiptesis son:
-

El promedio de kilmetros que dura una llanta radial Tiger Pow con banda
de acero es de ms de 96,500.
Una familia tpica mexicana vive en el mismo domicilio durante ms 16.5
aos.
El salario inicial promedio para los egresados de las carreras de contadura
en Mxico es de $38,000 pesos al ao.
Advil elimina los dolores de cabeza en menos de 20 minutos.

De esta manera comenzaremos por establecer algunas definiciones.


Hiptesis: Enunciado acerca de un parmetro de la poblacin, que se desarrolla
con el propsito de realizar pruebas.
Una vez que se ha establecido una hiptesis, se utilizan los datos para verificar
que tan razonable es dicha afirmacin. Un ejemplo puede ser el siguiente: En el
sistema legal de Mxico, una persona es inocente hasta que se demuestre lo
contrario. Un juez parte de la hiptesis de que una persona que es acusada de un
crimen es inocente y sujeta esta hiptesis a comprobacin, revisando la evidencia
y oyendo testimonios hasta llegar a un veredicto.
Prueba de hiptesis: Procedimiento que se basa en la evidencia de las muestras y
en la teora de probabilidad para determinar si la hiptesis es un enunciado
razonable.

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

Los trminos de prueba de hiptesis y probar una hiptesis se utilizan de manera


indistinta. La prueba de hiptesis se inicia con una afirmacin sobre un parmetro
de la poblacin: como la media de la poblacin. Como ya dijimos, esta afirmacin
se conoce como hiptesis. Una hiptesis podra ser que la comisin media
mensual que gana un agente de viajes en Mxico es de $6,000 pesos. No es
posible ponerse en contacto con todos los agentes de viajes del pas para
comprobar que la media de su ingreso mensual por comisiones sea efectivamente
de $6,000 pesos. El costo de localizar y encuestar a la totalidad de los agentes de
viajes del pas sera exorbitante. Para comprobar la validez de esta afirmacin
( = $6,000), es preciso elegir una muestra de la poblacin de todos los agentes
de viajes de Mxico, calcular la media y aceptar o rechazar la hiptesis, con base
en ciertas reglas de decisiones. Resulta obvio que una media muestral de $500
pesos de ingreso por comisiones para los agentes de viajes provocara un rechazo
de la hiptesis. Sin embargo, supn que el resultado de calcular la media de la
muestra es de $5,990 pesos. Esta cifra es bastante cercana a $6,000 para
aceptar como razonable la afirmacin de que la media poblacional es de $6,000?
Se puede atribuir la diferencia de $10 pesos entre las medias al error de
muestreo, o bien esta diferencia es significativa desde el punto de vista de la
estadstica?
A continuacin se propone y explica un procedimiento de 5 pasos para probar una
hiptesis.

Paso 1

Paso 4

Establecer las
hiptesis
nula y alterna

Seleccionar un
nivel de
significancia

Formular la
regla de
decisin

Identificar y
calcular la
estadstica de
prueba

Paso 2

Paso 3

No rechazar
rechazar
No
H0
H
Paso 5

Tomar una
decisin

Rechazar H
H0
Rechazar
0
yy
Aceptar H
H1
Aceptar
1

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

Paso 1. Plantear la hiptesis nula (H0) y la hiptesis alternativa (H1)


El primer paso consiste en establecer la hiptesis que se prueba. Se le conoce
como hiptesis nula y se le designa con H0. La letra H significa hiptesis y el subndice cero supone sin diferencia; es decir, la hiptesis nula supone que no hay
diferencia entre el parmetro de la poblacin y el de la muestra.
Hiptesis nula: Una afirmacin que establece que no hay diferencia significativa
entre el valor de un parmetro de la poblacin y el valor de un parmetro de la
muestra.
En el ejemplo del kilometraje que dura una llanta Tiger Pow, la hiptesis nula sera
que el nmero medio de kilmetros que recorre una llanta con banda de acero no
es distinto a 96,500. Esto se escribira as:
H0: = 96,500
Hablando en trminos generales, se plantea la hiptesis nula para el propsito de
la prueba; es decir, para aceptarla o para rechazarla. La hiptesis nula no se
rechaza a menos que los datos de la prueba proporcionen evidencia convincente
de que es falsa.
Es muy importante decir que si no se rechaza la hiptesis nula con base en los
datos de la muestra, eso no quiere decir que la hiptesis nula sea verdadera,
nicamente significa que no fue posible rechazar la hiptesis nula con base en lo
datos disponibles. Por lo tanto, la hipesis nula no se puede aceptar.
Para demostrar sin lugar a dudas que la hiptesis nula es verdadera sera
necesario conocer el parmetro de la poblacin; es decir, se tendra que practicar
un censo para conocer el parmetro de la poblacin sobre el que se est haciendo
una afirmacin. Por lo regular esto no es posible, por ello la alternativa consiste en
tomar una muestra.
Tambin es preciso enfatizar que generalmente una hiptesis nula comienza con o
contiene la siguiente afirmacin: No existe diferencia significativa entre...
De esta manera el planteamiento formal de la hiptesis nula del ejemplo anterior
sera el siguiente:
H0: La duracin promedio de las llantas radiales Tiger Pow con banda de acero no
tiene diferencia significativa con 96,500 kilmetros.
La hiptesis alternativa, por su parte, describe la conclusin a la que se llegar si
se rechaza la hiptesis nula. Se designa con H1 y tambin se conoce como
hiptesis de investigacin. La hiptesis alternativa se acepta si los datos de la

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

muestra proporcionan evidencia estadstica suficiente para afirmar que la hiptesis


nula es falsa.
Hiptesis alternativa: Una afirmacin que se acepta si los datos de la muestra
proporcionan evidencia suficiente de que la hiptesis nula es falsa.
Un ejemplo que ayudar a clarificar lo que significan la hiptesis nula y la hiptesis
alternativa es el siguiente: Un artculo reciente public que la vida promedio de los
aviones comerciales en Estados Unidos es de 15 aos. Para realizar una prueba
estadstica sobre esta afirmacin, el primer paso consiste en determinar la
hiptesis nula y la hiptesis alternativa.
H0: = 15 aos
H0: La vida promedio de los aviones comerciales en Estados Unidos no difiere
significativamente de 15 aos.
H1: 15 aos
H1: La vida promedio de los aviones comerciales en Estados Unidos difiere
significativamente de 15 aos.
Paso 2. Seleccionar un nivel de significancia.
Luego de establecer las hiptesis nula y alternativa, el siguiente paso consiste en
definir el nivel de significancia.
Nivel de significancia: La probabilidad de rechazar la hiptesis nula cuando es
verdadera. Probabilidad de cometer el error de tipo I.
El nivel de significancia se designa con , la letra griega alfa. Se le conoce
tambin como nivel de riesgo. Se le conoce as porque, como se expresa en la
definicin, representa el riesgo que se asume de rechazar la hiptesis nula cuando
sta es verdadera.
No hay un nivel de significancia que se aplique a todas las pruebas. De hecho es
un valor que se deja al criterio del investigador. De manera convencional se asigna
un nivel de significancia de 0.10 para encuestas polticas, de 0.05 (5 por ciento) a
los proyectos de investigacin de artculos de consumo o de ciencias sociales y de
0.01 para el aseguramiento de calidad o para estudios mdicos.
As, el investigador debe decidir el nivel de significancia antes de formular una
decisin y de recolectar datos sobre la muestra.
Para ilustrar como se puede rechazar una hiptesis nula cuando es verdadera
pondremos el siguiente ejemplo: Supn que la poltica de aceptacin de
4

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

embarques en un almacn de una empresa que se dedica a armar computadoras


personales es que El Departamento de Control de Calidad tomar una muestra
aleatoria de todos los embarques que se reciban. Si ms del 6% de los artculos
estn por debajo de la norma, el embarque ser rechazado.
El da de hoy se recibi un lote de 4,000 tarjetas madre del proveedor Allied
Technologies.
H0: El porcentaje de artculos defectuosos del embarque es 6% o menos.
H1: El porcentaje de artculos defectuosos del embarque es de ms 6%.
Se toma una muestra de 50 tarjetas madre y se encuentra que 4 de ellas son
defectuosas, es decir un 8%. El embarque se rechaz porque exceda el valor
mximo de 6% de artculos por debajo de la norma. Si ms del 6% de la totalidad
del embarque estaba defectuoso, entonces la decisin de rechazarlo fue correcta.
Supn, sin embargo, que las cuatro tarjetas seleccionadas en la muestra eran las
nicas defectuosas en todo el embarque de 4,000. Entonces slo el 0.1% estaba
defectuoso. En ese caso menos del 6% del embarque estaba por debajo de la
norma y el rechazo del embarque fue un error.
En trminos de prueba de hiptesis, se rechaz la hiptesis nula de que el
embarque estaba por debajo de la norma cuando ste debi aceptarse. Al
rechazar una hiptesis verdadera, se cometi un error de tipo I ( ).
Error de tipo I: Rechazar la hiptesis nula, H0, cuando es verdadera.
Luego entonces, existe otro tipo de error.
Error de tipo II: No rechazar la hiptesis nula, H0, cuando es falsa.
La empresa cometera un error de tipo II si, sin saberlo, recibiera un embarque que
contuviera el 15% de artculos defectuosos, y no obstante, lo aceptara. Cmo
podra ocurrir esto?
Supn que en un embarque similar se toma una muestra de 50 tarjetas de las
cuales 2 resultan defectuosas (4%) y las 48 restantes estn en buenas
condiciones. De acuerdo con la poltica de aceptacin de embarques, el lote
hubiera sido aceptado. Pero, por casualidad, podra ser que las 48 tarjetas en
buenas condiciones de la muestra fueran las nicas y que las 3,952 restantes
estuvieran defectuosas.
El siguiente cuadro resume las decisiones que el investigador puede tomar y las
consecuencias posibles de stas.

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

Hiptesis nula
H0 es verdad
H0 es falso

Investigador
No rechaza
Rechaza
H0
H0
Decisin correcta
Error de tipo I
Error de tipo II
Decisin correcta

Paso 3. Calcular el estadstico de prueba.


Existen muchas estadsticas de prueba. En este tema veremos z como estadstica
de prueba. En temas posteriores utilizaremos t y ji cuadrada.
Estadstica de prueba: Un valor que se calcula con base en informacin de la
muestra, y que se utiliza para determinar si se rechaza o no la hiptesis nula.
En la prueba de hiptesis para la media, la estadstica z se calcula por la siguiente
frmula.

Donde:
X = media de la muestra
= media de la poblacin
= desviacin estndar de la poblacin
n = tamao de la muestra
z = valor estndar
Cuando no se conoce el valor de la desviacin estndar de la poblacin (), se
puede utilizar el valor de la desviacin estndar de la muestra (s) para
aproximarlo.
El valor z se basa en la distribucin de muestreo de las medias de las muestras,
que, como ya hemos visto, tiene una distribucin normal cuando la muestra es
razonablemente grande, con una media igual a la media de la poblacin () y con
una desviacin estndar igual a /n. As es posible determinar si la diferencia
entre la media de la muestra ( x ) y la media de la poblacin () es importante

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

desde el punto de vista estadstico, al encontrar cuntas desviaciones estndar


separan a x de , utilizando la frmula anterior.

Paso 4. Formular la regla de decisin.


Regla de decisin: Es una afirmacin de las condiciones bajo las que se rechaza
la hiptesis nula y bajo las que no se rechaza.
El rea o regin de rechazo define la ubicacin de todos aquellos valores que son
tan grandes o tan pequeos que la probabilidad de que ocurran bajo una hiptesis
nula verdadera es bastante remota.
La siguiente grfica muestra la regin de rechazo de una prueba de significancia
que veremos ms a delante en este tema. Observa los siguientes puntos en el
diagrama:
a) El rea en la que no se rechaza la hiptesis nula est a la izquierda de
1.65. Ms adelante veremos como llegar a este valor.
b) El rea de rechazo est a la derecha de 1.65.
c) Se aplica una prueba de una cola. Tambin esto lo veremos ms adelante.
d) Se eligi un nivel de significancia de 0.05.
e) La distribucin de muestreo de z se distribuye normalmente.
f) El valor 1.65, que es el valor crtico, separa las regiones en las que se
rechaza y no se rechaza la hiptesis nula.
Valor crtico: Punto de divisin entre la regin en que se rechaza la hiptesis nula y
la regin en que no se rechaza.

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

Distribucin de muestreo para la estadstica z, prueba de una cola a la derecha, nivel de sig. 0.05

Paso 5. Tomar una decisin.


El ltimo paso consiste en tomar la decisin de rechazar o no la hiptesis nula.
Por ejemplo, con base en la grfica anterior, si al calcular el valor de z el resultado
es 2.34, la hiptesis nula se rechaza. La decisin de rechazar la hiptesis nula se
tom debido a que 2.34 se encuentra dentro de la regin de rechazo; es decir,
ms all de 1.65. De esta manera se puede afirmar que es altamente improbable
que un valor z que se calcula de este tamao (2.34) se deba a una variacin de
muestreo (casualidad).
En caso de que el valor calculado de z hubiera sido menor a 1.65, por ejemplo
0.71, la hiptesis nula no se habra rechazado. Se razonara entonces que un
valor tan pequeo no podra atribuirse a la casualidad, es decir, a la variacin de
muestreo.
Como puedes observar slo es posible tomar una de dos decisiones: ya sea
rechazar o no la hiptesis nula

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

4.4 , 4.5 y 4.6 Comprobacin de hiptesis referentes a la media de una


poblacin
Pruebas de significancia de una y dos colas
Antes de ver un ejercicio prctico sobre pruebas de hiptesis, estableceremos la
diferencia entre una prueba de dos colas y una de una sola.
En la grfica anterior se indica que se aplica una prueba de una cola. Por lo que la
regin de rechazo es solo una: la cola derecha de la distribucin, sin embargo es
tambin posible que la zona de rechazo se ubique en la cola derecha. Para
ilustrarlo pondremos el siguiente ejemplo.
Al departamento de empaque de Cereales Siglo XXI quiere hacer un estudio sobre
el peso neto de una presentacin de Rice & Grapes. El cereal se empaca en cajas
de 453 grs., de modo que las hiptesis quedan de la siguiente manera:
H0: 453 grs.
H0: El peso promedio de los cereales Rice & Grapes es igual o menor a 453
gramos.
H1: > 453 grs.
H1: El peso promedio de los cereales Rice & Grapes es mayor a 453 gramos.
Observa que el signo de desigualdad en la hiptesis alternativa seala a la
derecha o parte superior de la distribucin (Este ejemplo corresponde a la grfica
anterior). Asimismo observa que la hiptesis nula incluye el signo de igual.
Recuerda que la condicin de igualdad siempre aparece en la hiptesis nula y
nunca en la alternativa.
El siguiente diagrama muestra una situacin en la que la regin de rechazo se
encuentra en la parte izquierda (mnima) de la distribucin.

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

Regin de
rechazo

No rechazar
H0

0
Escala de z
1.65
valor crtico

Un ejemplo que corresponde a esta grfica puede ser el siguiente: Considera el


problema de los fabricantes de automviles, de las grandes empresas de
arrendamiento de autos o de cualquier organizacin que compre una gran
cantidad de llantas. Por ejemplo ellos desean que las llantas tengan una duracin
promedio de 96,500 km bajo condiciones normales de uso. Por lo tanto
rechazarn un embarque de llantas si las pruebas revelan que la vida media de
stas es muy inferior al promedio de 96,500 km y aceptarn gustosos un
embarque en el que encuentren que la vida promedio de las llantas es muy
superior a este lmite, en realidad esta posibilidad no les preocupa. En este caso
las hiptesis nula y alternativa seran:
H0: 96,500 kilmetros
H1: < 96,500 kilmetros
Una forma de determinar cul es la regin de rechazo consiste en observar el la
direccin del signo de desigualdad en la hiptesis alternativa (ya sea < o >). En
este caso seala a la izquierda y por lo tanto la regin de rechazo es la cola
izquierda o mnima de la distribucin.
En resumen, una prueba es de una cola cuando la hiptesis alternativa establece
una direccin, como:
H0: El ingreso medio de las mujeres es menor o igual al ingreso medio de los
hombres.

10

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

H1: El ingreso medio de los hombres es mayor que el ingreso medio de las
mujeres.
Por lo tanto, una prueba de dos colas ser aquella en la que la hiptesis
alternativa no establece una direccin, como:
H0: No hay diferencia entre el ingreso medio de las mujeres y el de los hombres.
H1: Existe una diferencia entre el ingreso medio de las mujeres y el de los
hombres.
Si se rechaza la hiptesis nula y se acepta la alternativa, en el caso de las dos
colas, el ingreso medio de los hombres podr ser mayor que el de las mujeres o
viceversa. Debido a que existen dos posibilidades, un rea de rechazo de 5% (por
ejemplo) se divide en partes iguales entre las dos colas de la distribucin (2.5 en
cada una).
La siguiente grfica ilustra las dos reas de rechazo y los valores crticos. Observa
que el rea total de la distribucin es de 1.000, que se encuentra por 0.95 + 0.025
+ 0.025.

Regin de
rechazo
0.025

No rechazar
H0

Regin de
rechazo
0.025

0.95
0
1.65
valor crtico

+1.65
valor crtico

Escala de z

Prueba de la media de la poblacin: muestra grande, desviacin estndar de


la poblacin conocida.
Un ejemplo en que se aplican los 5 pasos descritos anteriormente puede ser el
siguiente:

11

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

PM Steel es una compaa dedicada a fabricar y ensamblar muebles de oficina en


varias plantas distribuidas a los largo y ancho de la Repblica Mexicana. La
produccin del escritorio del modelo A325 en la planta de Len tiene una media
histrica de 200 piezas semanales y una desviacin estndar de 16 escritorios.
Hace poco, por la expansin del mercado, se introdujeron nuevos mtodos de
produccin y se contrat a nuevos empleados en esta planta. El Director de
Produccin quiere saber si como consecuencia de esto hubo algn cambio en la
produccin semanal del escritorio modelo A325 en esta planta. Dicho de otra
forma, el nmero de escritorios producidos en la planta de Len es diferente de
200 con un nivel de significancia de 0.01?
Los registros muestran que en la planta de Len, durante las 50 semanas hbiles
del ao anterior se produjo un promedio de 203.5 escritorios.
Paso 1
La hiptesis nula es la media de la poblacin es 200. La hiptesis alternativa es
entonces la media de la poblacin es diferente de 200 o la media de la
poblacin no es 200, o bien:
H0: = 200 escritorios
H1: 200 escritorios
Se trata de una prueba de dos colas, porque la hiptesis alternativa no establece
ninguna direccin. En otras palabras no afirma si la produccin media es mayor o
menor de 200 escritorios.
Paso 2
Como ya se dijo, se utiliza el nivel de significancia 0.01. Este es , la probabilidad
de cometer un error de tipo I. Es decir, es el riesgo de rechazar una hiptesis nula
verdadera.
Paso 3
La estadstica de prueba de una muestra grande es z. Transformar los datos de
produccin a unidades estndar (valores z) permite no slo utilizarlos en este
problema, sino tambin en otros problemas de prueba de hiptesis. La frmula,
como ya vimos, es:

12

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

z = (203.5 / 200) / (16 / 50)


z = 1.55
Paso 4
La regla de decisin se formula hallando los valores crticos de z con base en las
tablas del porcentaje de rea bajo la curva normal (tablas de z). Como se trata de
una prueba de dos colas, la mitad de 0.01, es decir 0.005, est en cada cola. Por
lo tanto, el rea en la que no se rechaza la hiptesis nula, entre los dos valores
crticos, es 0.99.
Las tablas del porcentaje del rea bajo la curva se basan en una mitad del rea
bajo la curva, o 0.5000. Luego, 0.500 0.005 es 0.4950, de modo que 0.4950 es
el rea entre 0 y el valor crtico. Localiza 0.4950 en el cuerpo de la tabla. EL valor
ms prximo es 0.4951.
A continuacin se lee el valor crtico en la fila y columnas correspondientes a
0.4951, este es 2.58. Por lo tanto la regla de decisin es:
Rechazar la hiptesis nula y aceptar la hiptesis alternativa, si el valor calculado
de z no est entre 2.58 y +2.58. No rechazar la hiptesis nula si z cae entre
2.58 y +2.58.
Paso 5
De acuerdo con el clculo del valor z que se hizo en el paso 3 y con la regla de
decisin formulada en el paso anterior, se llega a la conclusin de que la media de
la poblacin no es diferente de 200.
Esto debido a que z = 1.55 no cae en la regin de rechazo y por lo tanto no se
cuenta con elementos para rechazar la hiptesis nula (que dice que la media de
produccin de la poblacin es igual a 200 escritorios semanales).
As se indicar al Director de Produccin que la evidencia de la muestra no indica
que el nivel de produccin del escritorio A325 en la planta de Len haya cambiado
del nivel de 200 piezas por semana.
La diferencia de 3.5 unidades entre el nivel histrico de produccin y el del ltimo
ao puede atribuirse en gran medida a la casualidad.
El resumen de los cinco pasos se muestra en la siguiente grfica.

13

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

0.5000

0.5000

0.01
2

= 0.005

2
0.4950

-2.58
regin de
rechazo

0.01
2

= 0.005

0.4950
0
H0 no se rechaza

valor crtico

+2.58
regin de
rechazo
valor crtico

Escala de z

Se comprob que el nivel de ensamble segua siendo de 200 unidades a la


semana?. En realidad no. Desde el punto de vista tcnico, fue no poder
desaprobar la hiptesis nula. El no poder desaprobar la hiptesis nula de la que la
media de la poblacin es de 200 no es lo mismo que decir que es cierta.
Como dijimos al principio, la conclusin es anloga a la del sistema judicial. Para
explicarlo supn que se acusa a una persona de un delito, pero el juez la
absuelve. Si se absuelve a una persona de un delito, la conclusin fue que no
hubo suficientes evidencias para probar que el acusado era culpable (no que era
inocente). Esto es lo que se hace en una prueba de hiptesis estadstica cuando
se rechaza la hiptesis nula. La interpretacin correcta es que no fue posible
desaprobar la hiptesis nula.
Prueba de una cola
En el ejemplo anterior, slo interesaba informar al director de Produccin si hubo
un cambio en el promedio de escritorios producidos a la semana en la planta de
Len. No interesaba saber si el cambio fue un aumento o una disminucin en la
produccin.
Para ilustrar una prueba de una cola, se cambiar la pregunta. Supn que el
Director de Produccin lo que quiere saber es si hubo un aumento en el nmero
de unidades ensambladas.
En otras palabras, se puede concluir que, con base en las mejoras en los
mtodos de produccin y en la contratacin de nuevo personal, el nmero medio
de escritorios ensamblados en las ltimas 50 semanas fue mayor a 200?

14

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

Observas la diferencia en el modo en que se formula el problema. En el primer


caso, se quera saber si haba una diferencia en la media de escritorios
ensamblados, y ahora se desea saber si hubo un aumento.
Debido a que interesan preguntas diferentes, las hiptesis tambin son diferentes.
En smbolos quedara de la siguiente manera:
Prueba de dos colas

Prueba de una cola

H0: = 200 escritorios


H0: 200 escritorios
H1: 200 escritorios
H1: > 200 escritorios
Los
valores
crticos para una prueba de una cola y para una prueba de dos colas tambin son
distintos, por que para una prueba de una cola todo el riesgo se encuentra en una
sola direccin.
En el ejemplo anterior, se dividi a la mitad el nivel de significancia y se coloc la
regin de rechazo en las dos colas. Para la prueba de una cola el valor crtico
sera 2.33, que se encuentra por:
a) restar 0.01 de 0.5000 y
b) encontrar el valor z que corresponde a 0.4900
Ejercicio
Un estudio de la Asociacin Estadounidense de Refrescos mostr que el adulto
estadounidense tpico consume 68 litros de refresco de cola al ao. Segn esta
investigacin la desviacin estndar es de 11.3 litros. Una muestra aleatoria de 64
estudiantes universitarios revel que el ao pasado consumieron 64.2 litros en
promedio. En el nivel de significancia de 0.05.
a) Es posible concluir que existe una diferencia entre el consumo medio de
los estudiantes universitarios y el de los adultos en general?
b) Es posible concluir que el promedio de consumo para los estudiantes
universitarios es menor que para los adultos en general?
Respuesta inciso a)
Paso 1
La hiptesis nula es la media de la poblacin es 68. La hiptesis alternativa es
entonces la media de la poblacin es diferente de 68 o la media de la poblacin
no es 68, o bien:
H0: = 68 litros de refresco de cola al ao
15

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

H1: 68 litros de refresco al ao


Paso 2
Como ya se dijo, se utiliza el nivel de significancia 0.05. Este es , la probabilidad
de cometer un error de tipo I. Es decir, es el riesgo de rechazar una hiptesis nula
verdadera.
Paso 3
La estadstica de prueba de una muestra grande es z. Transformar los datos del
consumo de refrescos de cola a unidades estndar (valores z) permite no slo
utilizarlos en este problema, sino tambin en otros problemas de prueba de
hiptesis. La frmula, como ya vimos, es:

z = (64.2 - 68) / (11.3 / 64)


z = -2.69
Paso 4
La regla de decisin se formula hallando los valores crticos de z con base en las
tablas del porcentaje de rea bajo la curva normal (tablas de z). Como se trata de
una prueba de dos colas, la mitad de 0.05, es decir 0.025, est en cada cola. Por
lo tanto, el rea en la que no se rechaza la hiptesis nula, entre los dos valores
crticos, es 0.95.
Las tablas del porcentaje del rea bajo la curva se basan en una mitad del rea
bajo la curva, o 0.5000. Luego, 0.500 0.025 es 0.4750, de modo que 0.4750 es
el rea entre 0 y el valor crtico. Localiza 0.4750 en el cuerpo de la tabla.
A continuacin se lee el valor crtico en la fila y columnas correspondientes a
0.4750, este es 1.96. Por lo tanto la regla de decisin es:
Rechazar la hiptesis nula y aceptar la hiptesis alternativa, si el valor calculado
de z no est entre 1.96 y +1.96. No rechazar la hiptesis nula si z cae entre
1.96 y +1.96.
Paso 5

16

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

De acuerdo con el clculo del valor z que se hizo en el paso 3 y con la regla de
decisin formulada en el paso anterior, se llega a la conclusin de que la media de
la poblacin es diferente de 68.
Esto debido a que z = -2.69 no cae en la regin de rechazo y por lo tanto no se
cuenta con elementos para rechazar la hiptesis nula (que dice que la media de
produccin de la poblacin es igual a 68 litros de refresco de cola).
As se puede decir que la evidencia de la muestra indica que el nivel de consumo
anual de refresco de cola
es diferente para la muestra de estudiantes
universitarios y para la poblacin en general.
Otra forma de decirlo es que el consumo medio de refrescos de cola para los
estudiantes universitarios es diferente de 68 litros.
La diferencia de 3.87 litros entre el consumo de la poblacin en general y el de los
estudiantes universitarios no puede atribuirse a la casualidad.
Respuesta inciso b)
Paso 1
H0: 68 litros de refresco de cola al ao
H1: < 68 litros de refresco al ao
Paso 2
= 0.05
Paso 3

z = (64.2 - 68) / (11.3 / 64)


z = -2.69
Paso 4
Rechazar la hiptesis nula y aceptar la hiptesis alternativa, si el valor calculado
de z es menor que 1.65. No rechazar la hiptesis nula si z es mayor que 1.65.
Paso 5

17

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

De acuerdo con el clculo del valor z que se hizo en el paso 3 y con la regla de
decisin formulada en el paso anterior, se llega a la conclusin de que el consumo
medio de refresco de cola es menor de 68 litros.
Esto debido a que z = -2.69 cae en la regin de rechazo y por lo tanto se cuenta
con elementos para rechazar la hiptesis nula (que dice que la media de
produccin de la poblacin es mayor o igual a 68 litros de refresco de cola).
As se puede decir que la evidencia de la muestra indica que el nivel de consumo
anual de refresco de cola es menor para la muestra de estudiantes universitarios
que para la poblacin en general.
Otra forma de decirlo es que el consumo medio de refrescos de cola para los
estudiantes universitarios es menor de 68 litros.
La diferencia negativa de 3.87 litros entre el consumo de la poblacin en general y
el de los estudiantes universitarios no puede atribuirse a la casualidad.
Prueba de hiptesis para dos medias de poblacin (muestras grandes)
En esta seccin se ver al procedimiento para probar si dos medias poblacionales
son iguales con base e la informacin que se tiene de dos muestras de stas; o
bien, que la diferencia entre ambas medias muestrales es tan grande que se de
puede concluir que las medias poblacionales no son iguales. Algunas aplicaciones
de este tipo de planteamiento son las siguientes:

El gerente de una planta desea saber si el nmero medio de unidades


producidas durantes el turno de la maana es distinto al nmero medio de
unidades producidas durante el turno de la noche.
Un analista financiero desea saber si la tasa media de inters de los fondos
mutualistas de alto rendimiento es distinta de la tasa de rendimiento de los
fondos mutualistas globales.

Un planificador urbano desea saber si existe diferencia en la tarifa media


por hora de los contratistas en la Ciudad de Mxico y en la Ciudad de
Monterrey.
En estos casos es preciso seleccionar una muestra aleatoria de cada poblacin y
calcular su media, para posteriormente, utilizando el mtodo de los cinco pasos,
determinar si las medias poblacionales son iguales o existe alguna diferencia entre
ellas. Por su puesto hay una diferencia en la frmula del estadstico z.

18

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

Donde:
X1 = media de la primera muestra
X2 = media de la segunda muestra
S1 = desviacin estndar de la primera muestra
S2 = desviacin estndar de la segunda muestra
n1 = tamao de la primera muestra
n2 = tamao de la segunda muestra
z = valor estndar
En el siguiente ejemplo se ilustran los detalles de los clculos e interpretacin de
este tipo de pruebas.
Ejercicio
Se pide a cada uno de los pacientes del Hospital ABC que evalen el servicio
recibido en el momento de su alta. Hace poco, hubo algunas quejas de que los
mdicos y enfermeras residentes del rea de ciruga responden con demasiada
lentitud a los llamados de los pacientes de la tercera edad. De hecho, se afirma
que los dems pacientes reciben un servicio ms rpido. El Dr. Jos Luis Cuevas,
Director General del Hospital, pidi al departamento de aseguramiento de calidad
que investigara a respecto. Luego de hacer un estudio, el departamento report la
siguiente informacin basada en muestras de ambos tipos de pacientes:

Tipo de Paciente
De la tercera edad
Otros

Media de la muestra

Desviacin estndar
de la muestra

Tamao de la muestra

5.50 minutos
5.30 minutos

0.40 minutos
0.30 minutos

50
100

A un nivel de significancia de 0.01, es razonable concluir que el tiempo medio de


respuesta es mayor para las personas de la tercera edad?

19

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

Paso 1
H0: 1 2
H1: 1 > 2
Paso 2
= 0.01
Paso 3

z=

5.5 5.3
.402
50

.302
100

z = 0.2 / 0.064
z = 3.13
Paso 4
Rechazar la hiptesis nula y aceptar la hiptesis alternativa, si el valor calculado
de z excede 2.33. No rechazar la hiptesis nula si z es menor a 2.33.
Paso 5
Debido a que el valor calculado de z (3.13) es mayor que el valor crtico (2.33), se
rechaza la hiptesis nula y se acepta la de investigacin. Es decir, que con base
en la informacin de las muestras se puede concluir que el tiempo que los
doctores y enfermeras del Hospital ABC tardan en atender a los pacientes de la
tercera edad es mayor al que tardan en atender a lo dems pacientes.

20

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

4.2. y 4.3 Comprobacin de hiptesis referentes a la


una poblacin

proporcin de

Pruebas de hiptesis respecto de las proporciones


Las pruebas de hiptesis que hemos visto hasta el momento se han referido
nicamente a la media. Aunque, como podrs suponer, tambin se pueden hacer
pruebas de hiptesis respecto de proporciones. Algunos ejemplos de situaciones
en las que se puede aplicar este tipo de pruebas pueden ser los siguientes:

El director de Servicios Profesionales de la Universidad de Occidente


informa que el 80% de sus egresados se insertan en el mercado laboral en
puestos que guardan relacin directa con su campo de estudios.
El rea de ventas de Burger King afirma que el 45% de sus paquetes se
venden a travs de las ventanillas de venta a automovilistas.
Una empresa desea saber si existen diferencias entre las proporciones de
ejecutivos de sexo masculino y femenino que desean mudarse a otra
ciudad para lograr una promocin.

Proporcin. Una fraccin, relacin o porcentaje que indica la parte de una


poblacin o muestra que tiene una caracterstica de inters particular.
Un requisito para poder aplicar la prueba de hiptesis para las proporciones es
que tanto np como n(1-p) sean al menos de 5. Recuerda que:
n = tamao de la muestra
P = proporcin de la poblacin
Ejercicio
Supn que de acuerdo con informacin histrica de diferentes procesos
electorales en el Estado de Mxico, se sabe que es preciso que un candidato a
gobernador reciba por lo menos el 80% de los votos en la parte norte del Estado
para alcanzar la victoria. A la candidata del PRD le interesa evaluar sus
posibilidades de ganar y planea una encuesta de 2,000 votantes registrados en la
parte norte del Estado.
Los resultados de la encuesta indican que 1550 de los encestados estn
dispuestos a votar por el PRD.
21

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

Utiliza el procedimiento de la prueba de hiptesis y evala las posibilidades de que


la candidata del PRD sea la prxima gobernadora.
Solucin
Paso 1
H0: P 0.80
H1: P < 0.80
Paso 2
= 0.05
Paso 3
z es la estadstica apropiada
La frmula que se aplica es:

Donde:
p = proporcin de la muestra
P = proporcin de la poblacin
n = tamao de la muestra
p
= error estndar de la proporcin de la poblacin
Se calcula por p(1-p=/n de modo que la frmula se convierte en:

22

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

z = -0.280
Paso 4
Debido a que la prueba es de una cola y a que = 0.05, el valor crtico es de
1.65, as:
Rechazar la hiptesis nula y aceptar la alternativa si el valor calculado de z cae a
la izquierda de 1.65; de lo contrario, no rechazar la hiptesis nula.
Paso 5
El valor calculado de z (-0.280) no est en la regin de rechazo, de modo que la
hiptesis nula no se rechaza al nivel de significancia de 0.05.
Dicho de otro modo, la evidencia apoya la afirmacin de que la candidata del PRD
ganar las prximas elecciones.
Prueba para la comparacin de dos proporcines poblacionales.
Con frecuencia el inters radica en saber si dos proporciones de poblacin son
iguales. A continuacin se presentan varios ejemplos:

El Director de Recursos Humanos desea saber si existe una diferencia


entre la proporcin de empleados sindicalizados que faltan ms de cinco
das al ao con respecto a la proporcin de empleados no sindicalizados.
General Motors considera un nuevo diseo para el Pontiac Grand Am. Se
ensea el nuevo diseo a un grupo de compradores potenciales menores a
30 aos y a otro grupo de personas mayores a 60 aos. Los directivos de la
empresa desean saber si existe una diferencia entre las proporciones de
personas a las que les gusta el nuevo diseo dependiendo del grupo de
edad al que pertenezcan.
Aeromexico investiga el miedo a volar entre los adultos. De manera
especfica, desea saber si existe una diferencia en la proporcin de
hombres contra la de mujeres a quienes les da miedo volar.

Nota que en los ejemplos anteriores, y en todos los que se desea comparar
proporciones, cada artculo de la muestra puede clasificarse como xito o
23

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

fracaso. Es decir, no se trata de comparar mediciones (como en el caso de las


medias), sino valores nominales.
En este caso tambin, dado que las muestras deben ser mayores a 30 y tener una
distribucin normal, se utiliza el estadstico de la distribucin normal estndar, y el
valor de z se calcula por la siguiente frmula:

Donde:
n1 = tamao de la primera muestra
n2 = tamao de la segunda muestra
z = valor estndar
p1 = proporcin de la primera muestra
p2 = proporcin de la segunda muestra
pc = proporcin conjunta, que se calcula con la siguiente frmula:

Donde:
X1 = nmero de elementos que poseen la caracterstica buscada en la primera
muestra
X2 = nmero de elementos que poseen la caracterstica buscada en la segunda
muestra

24

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

Ejercicio
Hace poco, Avn desarroll un nuevo perfume que pretende comercializar bajo el
nombre de Belinda. Varias pruebas comparativas indican que Belinda tiene un
alto potencial de mercado. Para planear su estrategia de mercado, el
departamento de ventas de Avn desea saber si habr diferencias en el xito que
tenga el perfume entre las mujeres jvenes o maduras. Para ello se toman dos
muestras independientes, una de mujeres jvenes y otras de mujeres maduras. Se
usar una prueba en la que se pedir a cada una de las mujeres de la muestra
oler varios perfumes, entre los que se encuentra Belinda, y que indiquen cul es
el que les gusta ms.
Los resultados fueron los siguientes:
Tipo de mujeres
Jvenes
Maduras

Prefirieron
Belinda

Prefirieron otro

TOTAL

Proporcin de las
que prefirieron
Belinda

20
100

80
100

100
200

0.20
0.50

Se utilizar el procedimiento de prueba de hiptesis de cinco pasos.


Paso 1
H0: p1 = p2
H1: p1 p2
Paso 2
= 0.05
Paso 3

z = -0.30 / 0.06
z = -5.00

25

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

Paso 4
No rechazar la hiptesis nula, si el valor calculado de z cae entre 1.96 y +1.96.
Rechazar la hiptesis nula y aceptar la hiptesis de investigacin si z no cae entre
1.96 y +1.96.
Paso 5
Debido a que el valor calculado de z (-5.00) no cae entre los valores crticos (-1.96
y +1.96), se rechaza la hiptesis nula y se acepta la de investigacin. Es decir, que
con base en la informacin de las muestras se puede concluir que la proporcin de
mujeres jvenes que prefieren el perfume Belinda es distinta a la proporcin de
mujeres maduras.
Pruebas de hiptesis con muestras pequeas
En los casos anteriores se ha utilizado el estadstico de prueba de la distribucin
estndar o z. Para emplear este estadstico es necesario conocer la desviacin
estndar () de la poblacin o tener una muestra grande de ms de 30
observaciones.
Sin embargo, en muchos casos no se conoce y el nmero de observaciones de
la muestra es menor a 30. En estos casos, se puede utilizar la desviacin estndar
de la muestra (s) para aproximar (), pero no es posible utilizar la distribucin z
como estadstico de prueba. El estadstico de prueba adecuado es la t de Student,
o tambin conocida como distribucin t.
Cuando se utiliza la t de Student, se supone que la poblacin tiene una
distribucin normal. A continuacin se mencionan algunas caractersticas de esta
distribucin.
-

Al igual que la distribucin z, es una distribucin continua.

Al igual que la distribucin z, tiene forma de campana y es simtrica.

No hay una sola distribucin t, sino una familia de distribuciones t. Todas


con la misma media 0, pero con desviaciones estndar diferentes de
acuerdo con el tamao de la muestra n. Existe una distribucin t para una
muestra con 20 observaciones, otra distribucin t para una muestra con 21
observaciones y as sucesivamente.

26

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

La distribucin t es ms ancha y ms plana en el centro que la distribucin


z, sin embargo, a medida que aumenta el tamao de la muestra, la
distribucin t se aproxima a la distribucin normal estndar (z).

La distribucin t de Student tiene mayor amplitud que la distribucin z.


Como resultado de ello los valores crticos de t para un nivel de
significancia en particular son de mayor magnitud que los valores z
correspondientes. En otras palabras, debido a que existe una variabilidad
mayor en las medias de muestras calculadas a partir de muestras
pequeas, se tiene menos confianza en las estimaciones resultantes y son
menos apropiadas para rechazar la hiptesis nula.

Prueba para la media de la poblacin (muestras pequeas)


Supn que se quiere comparar la media de la muestra con una media poblacional
supuesta, y que el nmero de observaciones de la muestra es menor a 30. Supn
tambin, que es posible afirmar que la poblacin tiene una distribucin aproximada
a la normal, pero que si desviacin estndar no se conoce.
En este caso, se puede sustituir la desviacin estndar de la muestra por la
desviacin estndar de la poblacin, pero se tendr que utilizar la distribucin t
como estadstico de prueba. A continuacin se presenta un ejemplo que servir
para aterrizar estos conceptos.
Ejercicio
El Departamento de Siniestros de Seguros Monterrey informa que el costo
promedio de procesar cada caso (manejar la papelera, pagar al ajustador, etc.) es
de $600 pesos. Un estudio comparativo en el sector revel que este costo era ms
elevado que para las dems compaas. Como consecuencia de esto, se
implementa un plan para reducir gastos. Cuatro meses despus se toma una
muestra aleatoria de 26 casos y se calcula una media de $570 pesos, con una
desviacin estndar de $100. Con un nivel de significancia de 0.01, se podra
concluir que el plan de reduccin de gastos en realidad reduce el costo de
procesar cada caso?
Se utilizar el procedimiento de cinco pasos para la prueba de hiptesis.
Paso 1
H0: $600 pesos
H1: < $600 pesos

27

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

Paso 2
= 0.01
Paso 3

Donde:
X = media de la muestra
= media de la poblacin
s = desviacin estndar de la muestra
n = tamao de la muestra
t = (57-60) / (10 * 26)
t = -1.530
Paso 4
Los valores crticos de t se encuentran en las tablas de la Distribucin t de
Student. La columna de la izquierda tiene el encabezado de grados de libertad,
gl. El nmero de grados de libertad es el nmero de observaciones de la muestra
menos el nmero de muestras, escrito n 1. En este caso el nmero de
observaciones en la muestra es 26, por lo que hay 26 1 = 25 grados de libertad.
Para encontrar en valor crtico, primero se localiza la lnea de los grados de
libertad apropiados. Despus de determina si la prueba es de una o dos colas. En
este caso se tiene una prueba de una cola. Por lo tanto se encuentra en la parte
de la tabla titulada una cola. Se localiza la columna con el nivel de significancia
seleccionado, que en este caso es de 0.01. Se sigue la columna titulada una cola
0.01 hasta su interseccin con la fila correspondiente a 25 grados de libertad. El
valor es de 2.485. Como se trata de una prueba de una cola y la regin de rechazo
est en la cola izquierda, el valor crtico es negativo.
La regla de decisin es rechazar la hiptesis nula y aceptar la hiptesis de
investigacin si el valor calculado de t es menor a 2.485

28

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

Paso 5
Dado que el valor calculado de t (-1.530) est a la derecha del valor crtico (2.485); es decir, no est en la regin de rechazo, no se tienen elementos para
rechazar la hiptesis nula.
En otras palabras, no existe evidencia de que la diferencia de $30 pesos entre la
media de la poblacin y la media de la muestra sea estadsticamente significativa.
Dicho de otro modo, con base en la informacin de la muestra, no se cuenta con
elementos suficientes para afirmar que el plan de reduccin de costos ha
disminuidos realmente los gastos imputables al procesamiento de un caso de
siniestro.
Prueba para comparar dos medias poblacionales independientes (muestras
pequeas)
En el aparatado anterior se seleccion una sola muestra aleatoria y se compar su
media con el valor supuesto de la media poblacional. En este apartado se extiende
esta idea a dos muestras. La interrogante que se busca responder es si ambas
medias son iguales en trminos estadsticos. Se requiere de tres supuestos para
realizar esta prueba:
-

Las poblaciones muestreadas tienen una distribucin normal.


Las dos muestras son independientes.
Las desviaciones estndar de ambas poblaciones son iguales.

Como generalmente la varianza de la poblacin es desconocida, las dos varianzas


muestrales deben combinarse para hacer una estimacin de la varianza
poblacional. En esencia se calcula la media ponderada de las dos desviaciones
estndar muestrales y se utiliza esta estimacin de la desviacin estndar de la
poblacin.
La siguiente frmula se emplea para combinar las varianzas de la muestra.
Observa que se encuentran involucrados dos factores: el nmero de
observaciones de cada muestra y las propias desviaciones estndar de cada
muestra.

29

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

Donde:
S12 = es la varianza de la primera muestra
S22 = es la varianza de la segunda muestra
El valor de t se calcula con la siguiente frmula
:

Donde:
X1 = media de la primera muestra
X2 = media de la segunda muestra
n1 = tamao de la primera muestra
n2 = tamao de la segunda muestra
Sp2 = estimacin combinada de la varianza de la poblacin
Como ya dijimos, el nmero de grados de libertad es igual al nmero de elementos
muestreados menos el nmero de muestras. Debido a que hay dos muestras,
existen n1 + n2 2 grados de libertad.
Ejercicio
John Dere Mxico Es una empresa que, entre otras cosas, fabrica y ensambla
podadoras industriales que se embarcan a todos los pases de Amrica Latina. Se
han propuesto dos procedimientos para montar el motor sobre la estructura de las
podadoras. La pregunta es: existe alguna diferencia en el tiempo medio de cada
procedimiento para montar los motores sobre las estructuras de las podadoras?
El Ing. Gonzlez dise el primer procedimiento (procedimiento 1) y el Ing. Lpez
desarroll el segundo procedimiento (procedimiento 2).

30

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

Para evaluar ambos mtodos se decidi realizar un estudio de tiempos y


movimientos. Se tom el tiempo a 5 empleados utilizando el procedimiento 1 y a 6
empleados utilizando el procedimiento 2. A continuacin se muestran los
resultados en minutos. Para responder la pregunta planteada utiliza un nivel de
significancia de 0.10.
Procedimiento 1
(minutos)

Procedimiento 2
(minutos)

2
4
9
3
2

3
7
5
8
4
3

Paso 1
H0: 1 = 2
H1: 1 2
Paso 2
= 0.10
Paso 3
La t de Student se calcula en tres pasos:
a) Clculo de las desviaciones estndary de las medias de las muestras

X1

Procedimiento 1
X12

2
4
9
3
2
20

4
16
81
9
4
114

X2

Procedimiento 2
X22

3
7
5
8
4
3
30

9
49
25
64
16
9
172

31

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

s1 = 2.9155
s2 = 2.0976
X1 = 20 / 5 = 4
X2 = 30 / 6 = 5
b) Combinacin de las varianzas de las muestras

sp2 = 6.22222

c) Determinar t

t = 0.622

32

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

Paso 4
Los grados de libertad son iguales al nmero de elementos muestreados menos el
nmero de muestras. En este caso n 1 + n2 2 es igual a (5 + 6) 2 = 9 grados de
libertad.
As los valores crticos de t para gl = 9, para una prueba de dos colas y con nivel
de sognificancia 0.10, son +1.833 y 1.833.
Entonces, la regla de decisin es no rechazar la hiptesis nula si el valor calculado
de t cae entre 1.833 y + 1.833.
Paso 5
La decisin es no rechazar la hiptesis nula, ya que el valor calculado de t (-0.622)
cae entre los valores crticos (1.833 y +1.833).
Dicho de otro modo, la evidencia de las muestras indica que no hay elementos
suficientes para decir que existe una diferencia entre los tiempos de ensamblado
de los motores dependiendo del procedimiento que se use.

Prueba para comparar dos medias poblacionales dependientes (muestras


pequeas)
En el apartado anterior se prob la diferencia entre las medias a partir de dos
muestras independientes. Se compar la diferencia entre el tiempo promedio de
montaje de un motor utilizando el mtodo Gonzlez con el tiempo de montaje
utilizando el mtodo Lpez. Las muestras eran independientes, esto significa que
las muestras de los tiempos utilizando uno y otro mtodo no estaban relacionadas
de modo alguno.
Sin embargo, existen situaciones en las que las muestras no son independientes;
es decir, las muestras estn relacionadas o son dependientes. Un ejemplo de esto
puede ser el siguiente:
Imagina que Hipotecaria Bancomer contrata a dos firmas de bienes races para
que hagan una valoracin de las propiedades sobre las que presta dinero (BAITA y
HIR CASA), se supondra que ambas firmas haran valoraciones semejantes. Para
comprobarlo, Hipotecaria Bancomer selecciona 10 casas al azar y pide tanto a
BAITA como a HIR CASA que hagan una valuacin. Para cada casa habr un par
de valuaciones; es decir, cada casa tendr un valor estimado por BAITA y otro por
33

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

HIR CASA. Los valores estimados dependen de o estn relacionados con la casa
seleccionada. Esto tambin se conoce como muestra en pares.
Para la prueba de hiptesis el inters recae en la distribucin de las diferencias del
valor calculado. En consecuencia, slo hay una muestra. Para decirlo de manera
ms formal, se est investigando si la media de la distribucin de las diferencias
es cero.
La muestra se construye a partir de las diferencias entre los valores calculados por
BAITA y por HIR CASA para cada propiedad. Si las dos firmas reportan valores
semejantes, algunas veces BAITA estar ms alta y otras veces ser HIR CASA.
Sin embargo, se espera que la media de la distribucin de las diferencias sea
cero. En caso contrario, si una de las firmas constantemente reporta valores ms
altos, la media ser diferente de cero.
Se utiliza el smbolo d para indicar la media de la poblacin de la distribucin de
las diferencias. El estadstico de prueba es t y se calcula a partir de la siguiente
frmula.

Para esta frmula los grados de libertad se calculan por n 1, y


d = es media de la diferencia entre las observaciones por pares o relacionadas
sd = es desviacin estndar de la distribucin de las diferencias entre las
observaciones por pares o relacionadas
n = es el nmero de observaciones por pares
La desviacin estndar de las diferencias (sd) se calcula por:

34

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

Como en las pruebas anteriores, se supone que la poblacin de diferencias tiene


una distribucin normal. a continuacin se desarrolla el ejemplo citado:
Ejercicio
Los resultados de las valuaciones en miles de dlares de las dos compaas son
los siguientes:
Propiedad

BAITA

HIR CASA

1
2
3
4
5
6
7
8
9
10

135
110
131
142
105
130
131
110
125
149

128
105
119
140
98
123
127
115
122
145

Con un nivel de significancia de 0.05, puede decirse que existe una diferencia
entre la media de los valores calculados de las propiedades?
Paso 1
H0: d = 0
H1: d 0
Paso 2
= 0.05

Paso 3
35

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

La t de Student se calcula en tres pasos:


a) Clculo de la media de la diferencia entre las observaciones por pares
Valor calculado en miles de dlares
Propiedad

BAITA

HIR CASA

Diferencia ( d )

Diferencia al
cuadrado ( d2 )

1
2
3
4
5
6
7
8
9
10

135
110
131
142
105
130
131
110
125
149

128
105
119
140
98
123
127
115
122
145

7
5
12
2
7
7
4
-5
3
4
46

49
25
144
4
49
49
16
25
9
16
386

d = 4.60
b) Calculo de la desviacin estndar de la distribucin de las diferencias entre
las observaciones por pares o relacionadas

sd = 4.402

36

Universidad Panamericana
Estadstica II
Prof. Andrs Sandoval H

c) Determinar t

t = 3.305
Paso 4
Los grados de libertad son iguales al nmero de elementos muestreados menos el
nmero de muestras. En este caso n 1 1 es igual a 10 1 = 9 grados de libertad.
Porque hay 10 propiedades valuadas.
As los valores crticos de t para gl = 9, para una prueba de dos colas y con nivel
de sognificancia 0.05, son +2.262 y 2.262.
Entonces, la regla de decisin es no rechazar la hiptesis nula si el valor calculado
de t cae entre +2.262 y 2.262.
Paso 5
La decisin es rechazar la hiptesis nula, ya que el valor calculado de t (3.305) no
cae entre los valores crticos (+2.262 y 2.262).
Dicho de otro modo, la evidencia de la muestra indica que hay elementos
suficientes para decir que existe una diferencia entre las valoraciones que sobre
las mismas propiedades hacen las compaas BAITA y HIR CASA.

37

You might also like