You are on page 1of 9

CAPTULO VI

INTERVALOS DE CONFIANZA Y PRUEBAS DE HIPTESIS

Introduccin:

Ahora ya tenemos todos los elementos para introducirnos en el interesante tema de la


Inferencia Estadstica; entendindose sta como el procedimiento por el cual se llega a
inferencias respecto de una poblacin, con base en los resultados que se obtienen a
partir de una muestra extrada de esa poblacin.

Solo para destacar la importancia de la inferencia estadstica recordemos que una


poblacin de elementos es la mayor coleccin de elementos por los cuales se tiene cierto
inters en un instante particular o en un problema determinado. Por otro lado estas
poblaciones no las podemos manipular en su totalidad, ya que:

a) A veces son muy grandes o infinitas.


b) Otras veces no estn a nuestro alcance.
c) Es antieconmico su estudio sobre todo cuando el anlisis incluye pruebas
destructivas.
d) Nos basta solo una buena muestra para conocer la poblacin.

Estimacin de parmetros poblacionales.

Si nos interesa conocer algn parmetro poblacional y como se dijo anteriormente no es


posible estudiar toda poblacin, el recurso estadstico es hacer una estimacin de ese
parmetro en base a una muestra.

Grficamente se puede ver como sigue:

Esto significa que la media de la muestra X es un estimador de la media poblacional


y la varianza de la muestra S 2 es un estimador de la varianza poblacional 2 .
Un valor particular de X o de S 2 se llama una estimacin del parmetro poblacional
o 2 respectivamente.
Sin embargo normalmente hay varios estimadores de un parmetro poblacional y es
importante que en cada caso usemos el mejor.

Las caractersticas de un buen estimador son:

a) Insesgado.
b) Consistente.
c) Eficiente.

Una manera de definir las caractersticas anteriores es:

Definicin: Sea una estimacin del parmetro desconocido o asociado con la


distribucin de la variable aleatoria X . Entonces es un estimador insesgado para
si E para cualquier . Lo anterior significa que si obtenemos varias
estimaciones de y promediamos estos valores, este promedio sera muy prximo a
.

Definicin: Sea una estimacin (basada en una muestra x1 xn ) del parmetro .


Se dice que es una estimacin convergente o consistente de , si:

lim . P[ ] 0
para toda o
n

o equivalentemente, si

lim . P[ ] 1
para toda o
n

Como verificar la convergencia de un estimador aplicando esta definicin no es muy


fcil, se utiliza a veces el siguiente teorema:

Teorema: Sea una estimacin de basada en una muestra de tamao n .

lim . E lim . V 0
Si y si entonces es una estimacin convergente de
n n

. ( V significa varianza de ).

Definicin: Un estimador es ms eficiente que otro si tiene una varianza menor.

Resumiendo diremos que es el mejor estimador insesgado de si:


a) E
n
b) ai X i . Es decir, es una funcin lineal de la muestra.
i 1

c) V V * en donde * es cualquier otro estimador de que satisface


las relaciones a) y b) anteriores.

Estimaciones por puntos y por intervalos.

La estimacin de un parmetro poblacional dado como un nmero se llama estimacin


puntual.

Ejemplo: a b c
La estimacin de un parmetro poblacional dado por dos nmeros donde se tiene cierta
probabilidad de encontrar al parmetro se llama estimacin por intervalo.

Intervalos de confianza de parmetros poblacionales.

Considrese una variable aleatoria normal S con media S y desviacin estndar S .


La probabilidad de encontrar un valor de S entre dos nmeros a y b a b es:
Pa S b

Si a S z S

y b S z S

Entonces:
P S z S S S z S (6.1)
En este intervalo observamos que: S z S son los lmites de confianza; se conoce
como el nivel de confianza, z se llama valor crtico o coeficiente de confianza.

z depende de

Intervalos de confianza para la media de una poblacin normal.

_ _
Si sustituimos a S por x ya que x es normal como media _ y varianza _ , la
x x
ecuacin (6.1) queda como:
_

P _ z _ x _ z _ (6.2)
x x x x

esta ecuacin puede escribirse como:

_ _

P x z _ _ x z _ (6.3)
x x x

Cuando la varianza 2 es conocida o n 30 , la ecuacin anterior se transforma de la


siguiente manera:



_ y
_
x n x

_ _

P x z x z
n n

Valores z correspondientes a diferentes valores de se encuentra en la tabla de la


distribucin normal.

Ejemplo: Una muestra aleatoria de 16 nios de 10 aos de edad di un peso promedio


de 32 kg. Si la poblacin de los pesos de los nios de esta edad se distribuye
normalmente con una varianza de 9 kg 2 . Determine intervalos de confianza para el peso
promedio de toda la poblacin de donde procede la muestra.

a) Del 90% de confianza.


b) Del 95% de confianza.
c) Del 99% de confianza.

Datos: el valor de z se determina de la distribucin normal.


z (D)
. .
n 16 . .
_ . .
x 32 kg.
95 1.96
9 3kg.
. .
. .
99 2.576

Solucin:
0.90 _ _

a) P x z x z
z 1.645 n n


Como puede observarse en esta expresin, el termino z se suma y se resta a
n
_
x para obtener los lmites del intervalo y es conocido como el error mximo
mx . As:

mx z 1.645
3
1.234
n 16

P32 1.234 32 1.234 0.90

P30.766 33.234 0.90

Esto significa que hay una probabilidad o tenemos una confianza del 90% de que
el peso promedio de los nios de 10 aos est entre 30.766 y 30.234 .

De manera similar se contestan los incisos b) y c), solo cambia el valor de z.

0.95
b)
z 1.960

mx z 1.960
3
1.47
n 16

P32 1.47 32 1.47 0.95

P30.53 33.47 0.95

c) 0.99
mx 2.576 3
1.932
16

P32 1.932 32 1.932 0.99

P30.068 33.932 0.99

Como puede observarse a medida que aumentamos el nivel de confianza el


intervalo se va abriendo, esto significa que mientras ganamos confianza perdemos
precisin. No obstante podemos tener una alta confianza y la precisin deseada
pero para esto tendremos que aumentar el tamao de muestra ya que mx
diminuye a medida que n aumenta.
Para calcular el tamao de muestra necesario en una situacin particular solo hay
que despejar n de la frmula del error mximo.

mx z
n

2
z
n


mx

As si en el problema anterior queremos un intervalo cuya amplitud total sea 1


mx 0.5 ; para un nivel de confianza de 0.99.

2.576 3
2

n 239
0.5

Es obvio que entre ms grande sea la muestra el anlisis ser ms costoso ya que
no es lo mismo estudiar una muestra de tamao 16 que una de tamao 239, sobre
todo cuando las muestras se someten a pruebas destructivas.

Para tratar el caso en que la varianza poblacional 2 es desconocida y que n 30


hablaremos de una nueva distribucin llamada:

Distribucion t de Student.

Si a partir de una poblacin normal con media extraemos muestras aleatorias


de tamao n y si para cada muestra obtenemos el estadstico:

_
x
t
S
n

Esta cantidad sigue una distribucin llamada distribucin t de Student y tiene las
siguientes propiedades:

a) Tiene una media de cero.


b) Es simtrica respecto a la media.
c) En general tiene una varianza mayor que 1 pero la varianza tiende a 1 a
medida que el tamao de la muestra crece.
d) La variable t toma valores de a .
e) En realidad la distribucin t es una familia de distribuciones, ya que se
tiene una distribucin diferente para cada valor de n 1 el divisor usado al
calcular S 2 , correspondiente a la muestra.
f) Comparada con la distribucin normal, la distribucin t es menos alta en
el centro y tiene colas ms altas.

La siguiente figura compara a la distribucin t con la normal.

Figura 6.1. Comparacin de la distribucin normal y la distribucin t

La distribucin t como la normal, se ha tabulado en la tabla IV; se recordar que la


cantidad n 1 usada para calcular la varianza, se conoce como grados de libertad; por
tanto, se dice que existe una distribucin t diferente para cada valor de los grados de los
libertad y, como se ver, deben tomarse en cuenta cuando se use la tabla de distribucin
t.

Ahora estamos en condiciones determinar intervalos de confianza para la media de una


poblacin normal cuando la varianza 2 se desconoce y n<30.

De manera similar al caso de varianza 2 conocida.

_ S _
S
P x t x t
n n

donde los valores de t son tales que el rea bajo la curva de la distribucin entre t y
t es .

Ejemplo: Se hicieron determinaciones de amilasa en el suero, en una muestra de 15


sujetos normales. La muestra proporcion una media de 96 unidades/100 ml., y una
desviacin estndar de 35 unidades/100 ml.

A partir de estos datos determine intervalos de confianza para la media de la poblacin


de sujetos normales.

a) Del 95% de confianza.


b) Del 99% de confianza.

Datos:
n 15
_
x 96
s 35

a) 0.95
t0.975 2.14
V 14 (grados libertad)

mx t S
2.14
35
19.34
n 15

_ s _
s
P x t x t
n n

P96 19.34 96 19.34 0.95

P76.66 115.34 0.95

b) 0.99

t 0.995,14 2.98

mx t s
2.98
35
26.93
n 15

P96 26.93 96 26.93 0.99

P69.07 122.93 0.99

Este mtodo se puede extender para calcular intervalos de confianza para otros
parmetros poblacionales como el parmetro P de una distribucin binomial, la
diferencia entre dos medias poblacionales 1 2 , etc.
En el primer caso el intervalo quedara como:

Intervalos de confianza para P


_
_
_
_

P 1 P P 1 P
_ PP
_

P P z
n
z
n



Y en el segundo caso:

Intervalo de confianza para la diferencia de medias 1 2 .

a) Si se conocen las varianzas 12 y 22 .

_
_

P x1 x 2 z _ _ 1 2 x1 x 2 z _ _
_ _


x1 x 2

x1 x 2


_ _ 12 22 _ _ 12 22
P x1 x 2 z 1 2 x1 x 2 z
n n n n
1 2 1 2

b) Si las variantes 12 y 22 se desconocen se usa la distribucin t .


Se deja como ejercicio para el lector plantear la forma de los intervalos de confianza
para este caso.

You might also like