Intervalos de Confianza para Dos Poblaciones y Fórmulas

Intervalos de Confianza: dos poblaciones
Prof.: Jaime Pérez-Kallens L.
1.- Intervalo de Confianza para diferencia de medias de poblaciones

independientes con varianzas conocidas  12 y  22 respectivamente.
Estimador y estadístico:
x1  N ( 1 ;  12 )  12  22
x1  x 2  N ( 1   2 ;  )
x 2  N (  2 ;  22 ) n1 n2
El estadístico para este caso es:
( x1  x 2 )  ( 1   2 )
z
 12  22 y tiende a una distribución normal estándar

n1 n 2
Intervalo de confianza con un nivel de confianza de 1- 
 12  22  12  22
P(( x1  x2 )  z   1   2  ( x1  x2 )  z  )  1
2 n1 n2 2 n1 n2
Ejemplo:
Se llevan a cabo pruebas de resistencia a la tensión sobre dos diferentes

clases de largueros de aluminio utilizados en la fabricación de aviones
comerciales pequeños. De la experiencia pasada con el proceso de fabricación
de largueros y del procedimiento de prueba, se supone que la desviación
estándar de las resistencias a la tensión son conocidas. Los datos obtenidos
aparecen en la siguiente tabla:
Clase de larguero Tamaño de la Media muestral de Desviación estándar

muestra la resistencia a la de la población
tensión ( Kg/mm2) ( Kg/mm2)
1 10 87,6 1,0
2 12 74,5 1,5
a) En base a esta información entregada previamente, encuentre un intervalo

de confianza para la diferencia entre los promedios poblacionales de la
resistencia a la tensión con un nivel de confianza del 90%.
1
1,0 2 1,5 2
(87,6  74,4)  1,645 
10 12
12,22;13,98 kg / mm 2
b) ¿De acuerdo al resultado obtenido en a) qué puede concluir respecto a la

diferencia entre los promedios poblacionales con relación a la resistencia?
Existe diferencia entre la resistencia promedio a la tensión del larguero 1 y

larguero 2, ya que dentro del intervalo de confianza no se incluye el cero.
2.-Intervalo de Confianza para diferencia de medias de poblaciones normales e

independientes, con varianzas desconocida y suponiendo igualdad entre ellas
 12   22
1 1 1 1
P(( x1  x 2 )  t , n1  n2  2
Sp   1   2  ( x1  x 2 )  t ,n  n 2 S p  )  1
2 n1 n2 2 1 2
n1 n2
(n1  1) s12  (n 2  1) s 22
S p2 
n1  n 2  2
Ejemplo:
Un artículo publicado dio a conocer los resultados de un análisis del porcentaje

de calcio en cemento estándar y en cemento contaminado con plomo. Los
niveles bajos de calcio indican que el mecanismo de hidratación del cemento
queda bloqueado y esto permite que el agua ataque varias partes de una
estructura de cemento. Al tomar diez muestras de cemento estándar, se
encontró que el porcentaje promedio de calcio es de 90 con una desviación
estándar de 5; los resultados obtenidos con 15 muestras de cemento
contaminado con plomo fueron de 87 en promedio con una desviación estándar
de 4. Supóngase que el porcentaje de calcio está distribuido de manera normal.
Encuéntrese un intervalo de confianza del 95% para la diferencia entre medias

de los dos tipos de cementos. Supóngase que las dos poblaciones normales
tienen la misma varianza.
1. Solución:
El estimador combinado de la varianza es:
2
Al calcular la raíz cuadrada a este valor nos queda que s p = 4.41
1 1 1 1
( x1  x 2 ) ± s p  = (90-87)± 2,069 4,41 
n1 n2 10 15
El resultado es   0,72;6,72
Interpretación: Hay un 95% de probabilidad que la diferencia del

porcentaje promedio de calcio entre los dos tipos de cementos está
contenida entre -0,76 y 6,72.
b) Un experto manifiesta que no hay diferencia entre los dos tipos de

cementos, respecto al porcentaje del calcio contenido. En base al
resultado anterior ¿ qué podría manifestarle Ud. ?
Que puede tener razón, ya que el cero está contenido dentro del
intervalo. Indicando esta última cifra que no hay diferencias.
3.-Intervalo de Confianza para diferencia de medias de poblaciones normales e

independientes, con varianzas desconocida y suponiendo diferencia entre ellas
 12   22
Estimador y estadístico:
x1  N ( 1 ;  12 )  12  22
x1  x 2  N ( 1   2 ;  )
x 2  N (  2 ;  22 ) n1 n2
Pero las varianzas son desconocidas. Ello lleva a estimarlas y ha generar un

nuevo estimador para la varianza de diferencia de medias. Consecutivamente
se origina el siguiente estadístico:
( x1  x 2 )  ( 1   2 )
T= s12 s 22 que se distribuye como una t-

n1 n2
Student con g.l. grados de libertad que se obtiene de la siguiente expresión:
2
 s12 s 22 
  
gl   n1 n2  2
2 2
 s12  1  s2  1
    2 
 n1  n1  1  n2  n2  1
3
Intervalo de confianza:
s12 s 22 s12 s 22
P ( ( x1  x 2 ) - t    1   2  ( x1  x 2 ) + t   ) = 1
2
, g .l . n1 n2 2
, g .l . n 1 n 2
Problema:
Una compañía de taxis trata de decidir si comprar neumáticos de la marca A o

de la B para su flotilla de taxis. Para estimar la diferencia entre los promedios
de desgaste a través de Kms. recorridos, de las dos marcas, se lleva a cabo un
experimento utilizando 12 de cada marca. Los neumáticos se utilizan hasta que
se desgastan, dando como resultado promedio para la marca A 36.300
kilómetros, con una desviación estándar de 5000 kilómetros y para la marca B
38.100 kilómetros con una desviación estándar de 6100 kilómetros. Calcule un
intervalo de confianza de 95% para la diferencia promedio de las dos marcas,
si se sabe que las poblaciones se distribuyen de forma aproximadamente
normal para la marca A y para la marca B. Asuma que las dos varianzas
poblacionales son distintas.
Resp: [  6551,158; 2851,158 ]
4.- INTERVALO DE CONFIANZA PARA LA  D

(OBSERVACIONES PAREADAS)
Este es un procedimiento de estimación para la diferencia de dos medias

cuando las muestras son dependientes y las varianzas de las dos poblaciones
no necesariamente son iguales.
Las muestras pareadas involucran un procedimiento en el cual varios pares de
observaciones se equiparan de la manera más próxima posible, en términos de
características relevantes. Los dos grupos de observaciones son diferentes
sólo en un aspecto o "tratamiento". Toda diferencia subsiguiente en los dos
grupos se atribuye a dicho tratamiento. Las ventajas de las muestras pareadas
son:
1) Pueden utilizar muestras pequeñas.
2) Se encuentran varianzas más pequeñas.
3) Menos grados de libertad se pierden en el análisis.
4) Resulta un error de muestreo más pequeño (la variación entre

observaciones reduce debido a que corresponden de la forma más próxima
posible).
4
Otro método para utilizar muestras pareadas a diferencia de la situación que se
describió cuando las muestras son independientes, las condiciones de las dos
poblaciones no se signan de forma aleatoria a las unidades experimentales.
Más bien, cada unidad experimental homogénea recibe ambas condiciones
poblacionales; como resultado, cada unidad experimental tiene un par de
observaciones, una para cada población. Por ejemplo, si realizamos una
prueba de una nueva dieta con 15 individuos, el peso antes y después de llevar
a cabo la dieta forman la información de nuestras dos muestras. Estas dos
poblaciones son "antes" y "después" y la unidad experimental es el individuo.
Obviamente las observaciones en un par tienen algo en común. Para
determinar si la dieta es efectiva consideramos las diferencias d 1, d2, ……dn en
las observaciones pareadas. Estas diferencias son los valores de una muestra
aleatoria D1, D2, . . . . . Dn de una población de diferencias que supondremos
distribuidas normalmente con media  D  1   2 y varianza  D . Estimamos
2
 D2 mediante sd2 , la varianza de las diferencias que constituyen nuestra

muestra. El estimador puntual de  D será d
Se puede establecer un intervalo de confianza de (1 -  )100% para  D
- t/2 t/2
P (- t/2 < T < t/2)
Donde : El estadístico
d  D
T= sd se distribuye como una t de Student con n - 1 grados
n
de libertad
d i Sd 
 (d i  d )2
d n 1
n
Intervalo de confianza
sd sd
P ( d  t   D  d  t )  1
2
, n 1 n 2
, n 1 n
5
Ejemplo:
Se asume que se tienen puntajes respecto al tiempo empleado en cierta labor

de 10 empleados antes y después de habérseles impartido capacitación
laboral adicional. Establezca un intervalo de confianza del 90% para la media
de la diferencia en los puntajes antes y después de la capacitación.
Los puntajes aparecen en la tabla:
Solución
Datos
Empleado Puntaje antes de Puntaje después de
La capacitación del La capacitación del
empleado empleado di d i2
1 9.0 9.2 -0.2 0.04
2 7.3 8.2 -0.9 0.81
3 6.7 8.5 -1.8 3.24
4 5.3 4.9 0.4 0.16
5 8.7 8.9 -0.2 0.04
6 6.3 5.8 0.5 0.25
7 7.9 8.2 -0.3 0.09
8 7.3 7.8 -0.5 0.25
9 8.0 9.5 -1.5 2.25
10 8.0 8.5 -0.5 0.25
7.4 7.9 -5.0 7.38
Encontrar la estimación puntual y la desviación estándar muestral de d.
5
d= 10 = - 0.5 (estimación puntual de  D )
d i
2
 nd 2
=
7,3  10(0,5) 2
 0,736
s d2  i 1
9
n 1
Determinar los valores de la variable aleatoria t de acuerdo al nivel de

confianza preestablecido
P ( -1.833
 t 1.833 ) = 0.90
6
Encontrar los límites inferiores y superiores dentro de los cuales se encuentra
el parámetro
0.736
D
Límite superior de confianza : -0.5 + ( 1.833) 10 = -0.073
0.736
D
Límite inferior de confianza : -0.5 + ( 1.833) 10 = -0.927
Conclusión:
Debido a que se restan los puntajes posteriores al entrenamiento de los

puntajes anteriores al entrenamiento, produciendo valores negativos, se
puede estar 90% seguro de que la media de los puntajes posteriores al
entrenamiento está entre - 0.073 y - 0.927; ello denotaría que hay una
rebaja en los puntajes relativos a los tiempos empleados en cierta labor,
indicando a su vez una mayor eficiencia.
5.- INTERVALO DE CONFIANZA PARA EL COCIENTE DE VARIANZAS DE

DOS DISTRIBUCIONES NORMALES
El objetivo es averiguar si hay diferencias entre las dos varianzas

poblacionales.
Supóngase que se tienen dos poblaciones normales e independientes con

varianzas desconocidas  1 , 2 , respectivamente. De este par de poblaciones,
2 2
se tiene disponible dos muestras aleatorias de tamaños n1 y n2 ,

respectivamente; sean s12 y s 22 las dos varianzas muestrales. Se desea
encontrar un intervalo de confianza del 100(1 -  ) por ciento para el cociente
de las varianzas,  1 /  2 .
2 2
Para hallar el intervalo de confianza, recuérdese que la distribución de

muestreo de
7
(n1  1) s12
 12
n1  1 s12  22
F  ( 2 )( 2 )
(n2  1) s 22 s2  1
 22
n2  1
es una F de Fisher con n1  1 (en el numerador) y n2  1 (denominador) grados de

libertad. Esta distribución aparece en la figura
 /2
1  /2
f1 f
2 2
Luego, la construcción del intervalo de confianza del cociente se hará:
De modo que la varianza muestral mayor quede en el numerador del estadístico F. Así,
s12  22  12 s12
F 
s 22  12  22 Fs 22
Por consiguiente el intervalo de confianza es::
 
 s12  12 s12  f
P   2 
 1 1 , n1 1, n21 1
1
 f  , n1 1;n2  2 s 2  2
2 2
f 1 , n1 1,n2 1 s 2  2 f  , n2 1, n1 1
2
 2 2 
n1 : corresponde al tamaño de la muestra asociada a la varianza muestral mas grande.
Ejemplo:
8
Una empresa ha estado experimentando con dos disposiciones físicas distintas
de su línea de ensamble. Se ha determinado que ambas disposiciones
producen aproximadamente el mismo número de unidades terminadas al día. A
fin de obtener una disposición que permita un mayor control del proceso, usted
sugiere que se adopte de manera permanente la disposición que exhiba la
varianza más pequeña en el número de terminadas producidas al día. Dos
muestra aleatorias independientes producen los resultados que se muestran en
la tabla de más abajo. Establezca un intervalo de confianza del 95% para el
 12
cociente de las varianzas poblacionales . En base al resultado obtenido,
 22
¿cuál de los dos disposiciones recomendaría Ud. ?
Solución
Datos
Línea de Línea de
ensamble 1 ensamble 2
n 2 = 21 n1 = 25
s 22  1,432 s12  3,761
Estimación puntual
3,761  12
1,432 (estimador puntual insesgado de  22 )
- Nivel de confianza 0,95
Encontrar los límites inferiores y superiores dentro de los cuales se encuentra el

cociente de los parámetros
 12 3,761 1
( )( )  1,129
Límite superior de confianza de  2
2 : 1,432 2,327
 12
Límite inferior de confianza de  22 :
3,761 1
 1,0907
1,432 2,408
9
Conclusión:
 12
Se tiene una confianza del 95% que  22 este contenida entre 1,0907 y
1,129.
Puesto que 1 no está contenido en el intervalo entonces se puede confiar que
la varianza de la línea 1 es distinta a la varianza correspondiente para la línea
2.
6.- INTERVALO DE CONFIANZA PARA DIFERENCIAS DE PROPORCIONES.
Vamos a considerar que tenemos dos poblaciones de modo que en cada una
de ellas estudiamos una variable aleatoria dicotómica (Bernoulli) de parámetros
respectivos p1 y p2. De cada población se extraen muestras de tamaño n1 y n2,
respectivamente:
Entonces
Si las muestras son suficientemente grandes ocurre que el estadístico
( pˆ 1  pˆ 2 )  ( p1  p 2 )
Z= p1q1 p 2 q 2 tiende a una normal estándar

n1 n2
Donde:
n1 n2
 x1i y
x 2i
1  pˆ 1  qˆ1 y 1  pˆ 2  qˆ 2
pˆ 1  i 1
pˆ 2  i 1
n1 n2
10
Por el mismo razonamiento que en el caso de una población llegamos a que
una aproximación para un intervalo de confianza al nivel 1   para la
diferencia de proporciones de dos poblaciones es:
pˆ 1 qˆ1 pˆ 2 qˆ 2 pˆ 1 qˆ1 pˆ 2 qˆ 2
P ( pˆ 1  pˆ 2  z   p1  p 2  pˆ 1  pˆ 2  z  )  1
2 n1 n2 2 n1 n2
Ejemplo
Se está considerando cambiar el procedimiento de manufactura de partes.

Se toman muestras del procedimiento actual así como del nuevo para
determinar si este último resulta mejor. Si 75 de 1.000 artículos del
procedimiento actual presentaron defectos y lo mismo sucedió con 80 de 2.500
partes del nuevo, determine un intervalo de confianza del 90% para la
verdadera diferencia de proporciones de partes defectuosas.
75 80
pˆ 1  = 0,075 pˆ 2  = 0,032
1000 2500
0,075 * 0,925 0,032 * 0,968

pˆ 1  pˆ 2  0,043  = 0,00904
1000 2500
0,043 ± 1,645*0,00904
[ 0,028 ; 0,0579 ]
Con un nivel de confianza del 90% la diferencia entre las proporciones de

artículos defectuosos está contenida entre 0,028 y 0,0579. Ello lleva a concluir
que el nuevo procedimiento sería mejor que el actual.
11

Intervalos de Confianza para Dos Poblaciones y Fórmulas

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Intervalos de Confianza para Dos Poblaciones y Fórmulas

Uploaded by

Copyright:

Available Formats

Intervalos de Confianza: dos poblaciones

Prof.: Jaime Pérez-Kallens L.

1.- Intervalo de Confianza para diferencia de medias de poblaciones

El estadístico para este caso es:

Intervalo de confianza con un nivel de confianza de 1- 

Se llevan a cabo pruebas de resistencia a la tensión sobre dos diferentes

Clase de larguero Tamaño de la Media muestral de Desviación estándar

a) En base a esta información entregada previamente, encuentre un intervalo

b) ¿De acuerdo al resultado obtenido en a) qué puede concluir respecto a la

Existe diferencia entre la resistencia promedio a la tensión del larguero 1 y

2.-Intervalo de Confianza para diferencia de medias de poblaciones normales e

Un artículo publicado dio a conocer los resultados de un análisis del porcentaje

Encuéntrese un intervalo de confianza del 95% para la diferencia entre medias

El estimador combinado de la varianza es:

Interpretación: Hay un 95% de probabilidad que la diferencia del

b) Un experto manifiesta que no hay diferencia entre los dos tipos de

3.-Intervalo de Confianza para diferencia de medias de poblaciones normales e

Pero las varianzas son desconocidas. Ello lleva a estimarlas y ha generar un

Una compañía de taxis trata de decidir si comprar neumáticos de la marca A o

Resp: [  6551,158; 2851,158 ]

4.- INTERVALO DE CONFIANZA PARA LA  D

Este es un procedimiento de estimación para la diferencia de dos medias

2) Se encuentran varianzas más pequeñas.

3) Menos grados de libertad se pierden en el análisis.

4) Resulta un error de muestreo más pequeño (la variación entre

 D2 mediante sd2 , la varianza de las diferencias que constituyen nuestra

Se puede establecer un intervalo de confianza de (1 -  )100% para  D

P (- t/2 < T < t/2)

Se asume que se tienen puntajes respecto al tiempo empleado en cierta labor

Encontrar la estimación puntual y la desviación estándar muestral de d.

Determinar los valores de la variable aleatoria t de acuerdo al nivel de

Debido a que se restan los puntajes posteriores al entrenamiento de los

5.- INTERVALO DE CONFIANZA PARA EL COCIENTE DE VARIANZAS DE

El objetivo es averiguar si hay diferencias entre las dos varianzas

Supóngase que se tienen dos poblaciones normales e independientes con

se tiene disponible dos muestras aleatorias de tamaños n1 y n2 ,

Para hallar el intervalo de confianza, recuérdese que la distribución de

es una F de Fisher con n1  1 (en el numerador) y n2  1 (denominador) grados de

Luego, la construcción del intervalo de confianza del cociente se hará:

Por consiguiente el intervalo de confianza es::

n1 : corresponde al tamaño de la muestra asociada a la varianza muestral mas grande.

- Nivel de confianza 0,95

Encontrar los límites inferiores y superiores dentro de los cuales se encuentra el

6.- INTERVALO DE CONFIANZA PARA DIFERENCIAS DE PROPORCIONES.

Si las muestras son suficientemente grandes ocurre que el estadístico

Se está considerando cambiar el procedimiento de manufactura de partes.

0,075 * 0,925 0,032 * 0,968

Con un nivel de confianza del 90% la diferencia entre las proporciones de

You might also like