You are on page 1of 53

Estadística inferencial: Apuntes intervalo de

confianza

Integrantes: Catalina Gangas Moreno

Asignatura: Estadística II

Fecha: Martes 7 de agosto del 2018


Contenido
Apuntes de intervalo de confianza...................................................................................................... 3
¿Qué es un estimador? ................................................................................................................... 3
¿Qué es una estimación? ................................................................................................................ 3
¿Qué es un intervalo de confianza? ................................................................................................ 4
¿Qué es un nivel de confianza? ....................................................................................................... 4
¿Cuándo una estimación es puntual? ............................................................................................. 5
Intervalo de confianza para la media poblacional .............................................................................. 6
Caso 1: intervalo de confianza para la media de una distribución normal de varianza conocida. . 6
Ejemplos resueltos ...................................................................................................................... 8
Ejercicios propuestos ................................................................................................................ 10
Caso 2: intervalo de confianza para la media de una distribución normal de varianza
desconocida .................................................................................................................................. 11
Ejemplos resueltos .................................................................................................................... 12
Ejercicios propuestos ................................................................................................................ 14
Intervalo de confianza para la varianza ............................................................................................ 16
Ejemplos resueltos ........................................................................................................................ 17
Ejercicios propuestos .................................................................................................................... 19
Intervalo de confianza para la proporción ........................................................................................ 20
Error máximo admisible y tamaño de la muestra ......................................................................... 21
Ejemplos resueltos .................................................................................................................... 22
Ejercicios propuestos ................................................................................................................ 24
Intervalo de confianza para las diferencias de medias ..................................................................... 25
Intervalo de confianza para la diferencia de media con varianza conocidas pero diferentes, 𝜎1 ≠
𝜎2 .................................................................................................................................................. 25
Ejemplos resueltos .................................................................................................................... 26
Ejercicios propuestos ................................................................................................................ 28
Intervalo de confianza para la diferencia de media con varianza desconocidas pero iguales,
𝜎12 = 𝜎22 = 𝜎2 .......................................................................................................................... 30
Ejercicios resueltos .................................................................................................................... 31
Ejercicios propuestos ................................................................................................................ 33
Intervalo de confianza para la diferencia de media con varianza desconocidas pero diferentes,
𝜎12 ≠ 𝜎22 ≠ 𝜎2 .......................................................................................................................... 36
Ejemplos resueltos .................................................................................................................... 37

1
Ejercicios propuestos ................................................................................................................ 41
Intervalo de confianza para el cociente de varianzas ....................................................................... 43
Ejemplos resueltos ........................................................................................................................ 45
Ejercicios propuestos .................................................................................................................... 47
Intervalo de confianza para la diferencia de proporciones .............................................................. 48
Ejercicios resueltos ........................................................................................................................ 50
Ejercicios propuestos .................................................................................................................... 52

2
Apuntes de intervalo de confianza
En una población cuya distribución es conocida, pero desconocemos algún
parámetro, podemos estimar dicho parámetro a partir de una muestra
representativa.

¿Qué es un estimador?
Un estimador es un valor que puede calcularse a partir de los datos muestrales y
que proporciona información sobre el valor del parámetro, Por ejemplo, la media
muestral es un estimador de la media poblacional, la proporción observada en la
muestra es un estimador de la proporción en la población.

¿Qué es una estimación?


En inferencia estadística se llama estimación al conjunto de técnicas que permiten
dar un valor aproximado de un parámetro de una población a partir de los datos
proporcionados por una muestra. Por ejemplo, una estimación de la media de una
determinada característica de una población de tamaño N podría ser la media de esa
misma característica para una muestra de tamaño n.

Una estimación de intervalo de 𝜃 es un intervalo de la forma 𝜃̂1 < 𝜃 < 𝜃̂2 , donde 𝜃̂1
y 𝜃̂2 son valores de variables aleatorias apropiadas. Por “apropiada” queremos decir

 Un val or e stad íst i co es ca da uno de lo s di sti nt os re s ulta do s que se p ued en


obte ne r e n un est udi o estad ís ti co .
 Un parám etr o e stad ís tico es un núme ro q ue se ob tie ne a pa rtir de
los da to s d e una d is tri buci ó n e sta dís ti ca .
 Lo s pará metr os est adí sti co s s ir ve n pa ra s i nt etiza r la infor mació n dada p or
una ta bla o p or una gr áfi ca

𝑃(𝜃̂1 < 𝜃 < 𝜃̂2 ) = 1 − 𝛼

para alguna probabilidad especificada 1 − 𝛼 (vendría siendo el nivel de confianza).


Para un valor especificado de 1 − 𝛼, nos referimos a 𝜃̂1 < 𝜃 < 𝜃̂2 , como intervalo de
confianza (1 − 𝛼)100% para 𝜃.

3
¿Qué es un intervalo de confianza?
Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la
muestra, que posiblemente incluya el valor de un parámetro de población
desconocido. Debido a su naturaleza aleatoria, es poco probable que dos muestras
de una población en particular produzcan intervalos de confianza idénticos. Sin
embargo, si usted repitiera muchas veces su muestra, un determinado porcentaje
de los intervalos de confianza resultantes incluiría el parámetro de población
desconocido. Este parámetro será habitualmente una proporción en el caso de
variables dicotómicas, y la media para distribuciones normales.

¿Qué es un nivel de confianza?


Nivel de confianza es la probabilidad de que el intervalo calculado contenga al
verdadero valor del parámetro. Se indica por 1 − 𝛼 y habitualmente se da en
porcentaje (1 − 𝛼)100% (hablaremos de un nivel de confianza del 90%, del 95%,
del 99%, …). Hablamos de nivel de confianza y no de probabilidad ya que, una vez
extraída la muestra, el intervalo de confianza contendrá al verdadero valor del
parámetro o no, lo que sabemos es que si repitiésemos el proceso con muchas
muestras podríamos afirmar que el (1 )% de los intervalos así construidos
contendría al verdadero valor del parámetro. A la probabilidad de equivocarnos se
le denomina nivel de significación, y lo representamos por  . Lógicamente, cuanto
más pequeño sea  (es decir, cuanto más grande sea el nivel de confianza), la
probabilidad de equivocarnos será menor, pero el intervalo que calcularemos será
más grande y por tanto la precisión de la estimación será menor.

Dado un nivel de confianza, 1 , se llama valor crítico 2  z al valor que en una N

(0,1) cumple que: 𝑃 (−𝑧𝛼⁄2 ≤ 𝑧 ≤ 𝑧𝛼⁄2 ) = 1 − 𝛼

4
Es decir:

¿Cuándo una estimación es puntual?


Una estimación es puntual cuando se obtiene un solo valor para el parámetro. Los
estimadores más probables en este caso son los estadísticos obtenidos en la
muestra, los estadísticos son variables aleatorias que dependen de la muestra y que
tienen una distribución de probabilidad, a la que hemos llamado distribución
muestral del estadístico. Esta distribución depende de la población, del tipo de
muestreo que se realiza y del tamaño de la muestra, aunque es necesario cuantificar
el riesgo que se asume al considerarlos.

5
Intervalo de confianza para la media poblacional
Dada una variable aleatoria con distribución Normal N (μ, σ), el objetivo es la
construcción de un intervalo de confianza para el parámetro μ, basado en una
muestra de tamaño n de la variable.

Desde el punto de vista didáctico hemos de considerar dos posibilidades sobre la


desviación típica de la variable: que sea conocida o que sea desconocida y tengamos
que estimarla a partir de la muestra.

Caso 1: intervalo de confianza para la media de una distribución normal de varianza


conocida.
Se trata de encontrar un intervalo aleatorio para la media de una distribución normal
𝑁 (𝜇, 𝜎 2 ).

Como estimador, tomamos la media de una muestra de tamaño n.

Sabemos, por el teorema central del límite, que la media muestral 𝑥̅ tiene una
𝜎
distribución normal 𝑁 (𝜇, ).
√𝑛

𝑥̅ −𝜇
Por tanto, la variable tipificada 𝑧 = 𝜎 se distribuye según una normal N (0,1).
⁄ 𝑛

Si elegimos un nivel de significación 𝛼 = 0,05, tendremos que hallar dos valores 𝜆1


y 𝜆2 tales que 𝑃(𝜆1 ≤ 𝑧 ≤ 𝜆2 ) = 1 − 𝛼

En el caso de la normal N (0,1), sabemos encontrar estos valores críticos, que


vienen tabulados y que representamos por −𝑧𝛼⁄2 y 𝑧𝛼⁄2, ya que determinan el área

de la función de densidad comprendida entre ambos, dejando fuera dos colas


correspondientes cada una a un área de 𝛼⁄2, según puede apreciarse en la figura.

6
Por lo tanto, debe verificarse:

𝑥̅ − 𝜇
𝑃 (−𝑧𝛼⁄2 ≤ 𝜎 ≤ 𝑧𝛼⁄2 ) = 1 − 𝛼
⁄ 𝑛

Multiplicando cada termino de las desigualdades por 𝜎⁄ , se obtiene:
√𝑛

𝑃 (−𝑧𝛼⁄2 𝜎⁄ ≤ 𝑥̅ − 𝜇 ≤ 𝑧𝛼⁄2 𝜎⁄ ) = 1 − 𝛼
√𝑛 √𝑛
Si se resta 𝑥̅ a cada uno de los términos, resulta:

𝑃 (−𝑥̅ −𝑧𝛼⁄2 𝜎⁄ ≤ 𝜇 ≤ −𝑥̅ + 𝑧𝛼⁄2 𝜎⁄ ) = 1 − 𝛼


√𝑛 √𝑛
Multiplicando ahora por -1 cada uno de los términos, se invierte el orden de las
desigualdades, resultando:

𝑃 (𝑥̅ −𝑧𝛼⁄2 𝜎⁄ ≤ 𝜇 ≤ 𝑥̅ + 𝑧𝛼⁄2 𝜎⁄ ) = 1 − 𝛼


√𝑛 √𝑛
Se obtiene así el intervalo de confianza aleatorio
𝐼 = [𝑥̅ −𝑧1−𝛼⁄ 𝜎⁄ ; 𝑥̅ + 𝑧1−𝛼⁄ 𝜎⁄ ]
2 √𝑛 2 √𝑛
Este intervalo es tal que contiene el valor del parámetro con una probabilidad igual
a 1 − 𝛼.
De esta forma se deduce que el error de estimación este definido como:
𝐸𝐸 = 𝑧1−𝛼⁄2 𝜎⁄
√𝑛

7
Ejemplos resueltos
1) Un equipo de profesores de educación física está interesado en conocer el
número promedio de flexiones continuadas que realizan sus alumnos. Para
ello, seleccionan una muestra aleatoria de 80 estudiantes, cuyos resultados
figuran en la siguiente tabla:

N° de 35 41 45 46 48 50 52 53 54 56 60
flexiones
N° de 5 6 5 2, 10 15 6 11 10 5 5
alumnos
Hallar el nivel de confianza al 95%
Datos:
Calculamos el valor crítico para el nivel de confianza del 95%. Y buscamos ahora
en la tabla el valor de Z que deja a la izquierda una probabilidad de 0,95,
obteniendo (aprox.):
 𝑍1−𝛼 = 𝑍1−0,05 = 𝑍0,975 = 1,96
2 2
 n°= 80
 𝑥̅ = 49,78
 𝛼 = 2,75
Sustituyendo en la formula del intervalo de confianza:
𝐼 = [𝑥̅ −𝑧1−𝛼⁄ 𝜎⁄ ; 𝑥̅ + 𝑧1−𝛼⁄ 𝜎⁄ ]
2 √𝑛 2 √𝑛

2,75 2,75
𝐼 = [49,78 − 1,96 ∗ ; 49,78 + 1,96 ∗ ]
√80 √80

𝐼 = [49,18 ; 50,38]
∴ El número promedio de flexiones continuadas que realizan sus alumnos con un
intervalo de confianza para el 95% será: 𝐼𝐶95 = [49,18 ; 50,38].

2) Un equipo de expertos en eficiencia intenta usar la media de una muestra


aleatoria de tamaño n=150 para estimar el promedio de la aptitud mecánica
de los trabajadores de una línea de ensamble en una industria grande (según
la mide cierta prueba estandarizada). Si basados en la experiencia, los
expertos en eficiencia pueden suponer que 𝜎 = 6,2 para esos datos. ¿Qué

8
pueden afirmar con probabilidad de 0,99 acerca del error máximo de su
estimación?

Datos:

 n = 150
 𝜎 = 6.2
 𝑍1−𝛼 = 𝑍1−0,01 = 𝑍0,995 = 2,58
2 2

Sustituimos en la expresión para el error máximo, y obtenemos.

𝐸𝐸 = 𝑧1−𝛼⁄2 ∗ 𝜎⁄
√𝑛

𝐸𝐸 = 𝑧1−0,01⁄ ∗ 6,2⁄
2 √150

𝐸𝐸 = 2,58 ∗ 6,2⁄
√150
𝐸𝐸 = 1,306067931
Así, los expertos en eficiencia pueden afirmar con probabilidad de 0,99 que su
error será menor que 1,306067931

9
Ejercicios propuestos
1) Un meso terapeuta desea estimar, con el 95% de confianza, la media de fuerza
máxima de un músculo particular en cierto grupo de personas. Se inclina a
suponer que los valores de dicha fuerza muestran una distribución
aproximadamente normal con una varianza de 121. Una muestra de 24
individuos que participaron en el experimento proporcionó una media de 84.6.
2) Suponga que un investigador, interesado en obtener una estimación del nivel
promedio de alguna molécula proteica en cierta población de seres humanos,
toma una muestra de 25 individuos, determina el nivel de la molécula proteica
en cada uno de ellos, y calcula la media de la muestra 𝑥̅ = 34. Además, que la
variable de interés sigue una distribución normal, con una varianza de 39. Se
desea estimar el valor de µ.
3) Si se puede realizar la hipótesis de que el consumo de combustible sigue una
distribución normal, veamos el intervalo de confianza para la media al 95%,
suponiendo conocida la varianza (igual a 7684,3 𝑙 2 ). Se recoge una muestra
aleatoria simple de tamaño 20, y se obtiene una media muestral de 3937,9 𝑙.
4) El tiempo de renovación de un teléfono móvil, expresado en años, se puede
aproximar mediante una distribución normal con desviación típica 0,4 años. Se
toma una muestra aleatoria simple de 100 usuarios y se obtiene una media
muestral igual a 1,5 años. Determínese un intervalo de confianza al 95% para
el tiempo medio de renovación de un teléfono móvil.
5) En una población normal con varianza conocida se ha tomado una muestra de
tamaño 49 votantes para escoger a un tesorero y se ha calculado su media: x
=4,2. Determine la varianza de la población sabiendo que el intervalo de
confianza al 95% para la media poblacional es (3.64, 4.76).

10
Caso 2: intervalo de confianza para la media de una distribución normal de varianza
desconocida.

Cuando se desconoce la varianza poblacional, es necesario estimarla a partir de la


muestra. Como estimador de la misma se utiliza la varianza.

Por el <<cálculo de probabilidades>>, sabemos que:

A) La varianza, 𝑠 2 , es un estimador insesgado (se dice si un estimador es insesgado, si el


valor esperado del mismo es igual al parámetro de la población que estima) de la varianza
poblacional.
B) La desviación típica muestral, 𝑠, es un estimador insesgado de la desviación
típica de la población.
𝑥̅ −𝜇
C) La distribución de la variable 𝑡 = 𝑠 es una t de Student con n-1 g.l.
√𝑛

Utilizando s como estimador de la desviación típica poblacional, podemos determinar


un intervalo con un coeficiente de confianza 1 − 𝛼. La tabla de la distribución de t
de Student, para 𝑛 − 1 g.l. y un nivel de significación 𝛼 nos proporciona un valor
critico tal que 𝑡𝛼
2

𝑝 (−𝑡𝛼 ≤ 𝑡 ≤ 𝑡𝛼 ) = 1 − 𝛼
2 2

𝑥̅ −𝜇 𝑥̅ −𝜇
Como 𝑡 = 𝑠 , será 𝑝 (−𝑡𝛼 ≤ 𝑠 ≤ 𝑡𝛼 ) = 1 − 𝛼
⁄ 𝑛 2 ⁄ 𝑛 2
√ √

Multiplicando cada miembro de las desigualdades por𝑠⁄ , restando después 𝑥̅ , y,


√𝑛
multiplicando finalmente por -1 para cambiar de sentido las desigualdades, se

obtiene: 𝑝 (𝑥̅ − 𝑡𝛼 𝑠⁄ ≤ 𝜇 ≤ 𝑥̅ + 𝑡𝛼 𝑠⁄ ) = 1 − 𝛼
2 √𝑛 2 √𝑛

Con lo que se consigue el intervalo de confianza aleatorio

𝐼 = (𝑥̅ − 𝑡𝛼 𝑠⁄ ; 𝑥̅ + 𝑡𝛼 𝑠⁄ )
2 √𝑛 2 √𝑛

11
Ejemplos resueltos
1) Se trata de hallar un intervalo de confianza del 95% para cubrir la vida media de
una población de lámparas halógenas a partir de los resultados que se han
obtenido en una muestra de 20 lámparas, cuyos periodos de duración
(expresados en horas) han sido:

480 345 427 386 432 429 378 440 434 503
436 451 466 394 422 412 507 433 480 429
Se supone que la duración de las lámparas sigue una distribución normal, pero se
desconocen la media y la varianza de la población.

Como se desconocen los valores de la media y la varianza de la población se utilizan


los valores de la media muestral y varianza muestral porque nos habla de una
muestra de 20 lámparas de una cierta cantidad de poblaciones de lámparas.

Por ejemplo: Es decir se dice que de una población de 100 lámparas halógenas se
escogen una muestra de 20 lámparas halógenas.

𝑥̅ = 434,2

𝑠 = 40,63

Si fijamos un nivel de significación 𝛼 = 0,05, al ser n=20, la variable

𝑥̅ − 𝜇
𝑡=𝑠
⁄ 𝑛

Sigue una distribución de Student con 19 g.l. El nivel 𝛼 = 0,05 proporciona en las
tablas un valor critico 𝑡𝑜,𝑜25 = 2,093.

El intervalo de confianza del 95% es, por lo tanto:

40,63 40,63
𝐼 = (434,2 − 2,093 ∗ ; 434,2 + 2,093 ∗
√20 √20

Es decir: 𝐼 = (415,18 ; 453,21). Este intervalo puede cubrir o no el verdadero valor


del parámetro (vida media de las lamparas).

12
2) Un psicólogo escolar quiere estimar la media de tiempo de reacción a un
determinado estimulo de los alumnos de 1° de primaria. Para ello ha elegido una
muestra de 35 niños obteniendo un tiempo medio de 1,12 minutos y una
desviación típica de 0,21 minutos. Hallar el intervalo de confianza para el tiempo
medio de reacción con un nivel de significación del 8%.

Como n es grande, podemos usar la formula del intervalo de confianza usando la


desviación típica pues desconocemos la de la población:

(𝑥̅ − 𝑧𝛼 𝑠⁄ ; 𝑥̅ + 𝑧𝛼 𝑠⁄ )
2 √𝑛 2 √𝑛

Datos

 n = 35
 𝑠 = 0,21
 𝑥̅ = 1,12
 𝑍1−𝛼 = 𝑍1−0,08 = 𝑍0,96 = 1,75
2 2

Calculamos el valor crítico para el nivel de confianza del 92% (pues 𝛼 = 0,08)
luego:

(𝑥̅ − 𝑧𝛼 𝑠⁄ ; 𝑥̅ + 𝑧𝛼 𝑠⁄ )
2 √𝑛 2 √𝑛

𝐼 = (1,12 − 1,75 ∗ 0,21⁄ ; 1,12 + 1,75 ∗ 0,21⁄ )


√35 √35

𝐼 = (1,06 ; 1,18)

Y por tanto el intervalo de confianza será: I = (1,06 ; 1,18).

13
Ejercicios propuestos
1) Se utilizaron dos grupos de estudiantes, uno de los grupos es de un colegio
particular para aplicar el experimento y el otro grupo de un colegio municipal
como control. El grupo con el que se experimentó recibió una hora de charla por
partes de un trabajador de una universidad para informales sobre sus carreras y
el modo de postulación. El grupo de control no recibió esta charla. Para evaluar
el esfuerzo de cada estudiante por estudiar, matemática, lenguaje, ciencias y
historia dentro del entorno educacional universitaria, se utilizó una lista de cotejo
para la evaluación de postulación que incluye criterios de referencia. Una tarea
bien hecha recibió una calificación de 1. El grupo de control, formado por 15
individuos, alcanzo una calificación media de 15.9 en la evaluación, con una
desviación estándar de 3.681. Se supone que el grupo de control se comportó
como una muestra aleatoria extraída de una población similar de individuos. Se
pretende utilizar los datos de la muestra para estimar la calificación media para
la población.

2) Un equipo de investigadores está interesado en la puntualidad de los pacientes


en las citas concertadas. En un estudio de flujo de pacientes en los consultorios
de médicos generales se encontr6 que una muestra de 35 pacientes llegaba 17.2
minutos tarde a las citas, en promedio. Una investigaci6n previa había
demostrado que la desviación estándar era de 8 minutos aproximadamente. Se
tuvo la sensaci6n de que la distribuci6n de la poblaci6n no era normal. ¿Cuál es
el intervalo de confianza de 90 por ciento para 11, que es el promedio real de
impuntualidad en las citas?
3) En una población, una variable aleatoria sigue una ley Normal de media
desconocida y desviación típica 3.
a) A partir de una muestra de tamaño 30 se ha obtenido una media muestral igual
a 7. Halle un intervalo de confianza, al 96%, para la media de la población.
b) ¿Qué tamaño mínimo debe tener la muestra con la cual se estime la media, con
un nivel de confianza del 99% y un error máximo admisible de 2

14
4) Se desea estimar la concentración media de amilasa en suero de una población
sana. Las mediciones se efectuaron en una muestra de 15 individuos
aparentemente saludables. La muestra proporcionó una media de 96
unidades/100ml y una desviación estándar de 35 unidades/100ml. La varianza
se desconoce.
5) Se ha obtenido una muestra de 15 vendedores de una Editorial para estimar el
valor medio de las ventas por trabajador en la Empresa. La media y varianza de
la muestra (en miles de euros) son 5 y 2, respectivamente.
a) Intervalo de confianza para la venta media por trabajador en la Editorial al 90
%.
b) Intervalo de confianza para la varianza de las ventas por trabajador en la
Editorial al 90 %.

15
Intervalo de confianza para la varianza
La varianza poblacional suele ser desconocida. Para estimarla, se utiliza la cuasi
varianza muestral, que es un estimador insesgado de la varianza de la población. Si
se pretende hallar un intervalo de confianza para la varianza, cuando la muestra se
obtiene a partir de una población normal, sabemos que el estadístico

(𝑛 − 1)𝑠 2
𝑥=
𝜎2

Se distribuye según una 𝑥 2 de Pearson con n-1 grados de libertad.

Por consiguiente, fijado un nivel de significación 𝛼, se tiene que

2 2 2
𝑝 = (𝑥1− 𝛼⁄ < 𝑥 < 𝑥𝛼⁄ ) = 1 − 𝛼
2 2

Siendo 𝑥𝛼2⁄ el valor de la 𝑥 2 con n-1 g.l. que deja un área de 𝛼⁄2 unidades a la
2

derecha y 𝑥1−2 𝛼
𝛼⁄ el valor de la 𝑥 con n-1 g.l., que deja un área de 1 − ⁄ a la
2
2 2
izquierda.

(𝑛−1)𝑠2
Sustituyendo el valor de 𝑥 2 , resulta: 𝑝 = (𝑥1−
2
𝛼⁄ < < 𝑥𝛼2⁄ ) = 1 − 𝛼
2 𝜎2 2

Si dividimos cada termino de las desigualdades por (𝑛 − 1)𝑠 2 , al tratarse de una


cantidad positiva, se mantiene el orden de las mismas:

2 1 1 1
𝑝 = (𝑥1− 𝛼⁄ ∗ 2
< 2 < 𝑥𝛼2⁄ ∗ )= 1−𝛼
2 (𝑛 − 1)𝑠 𝜎 2 (𝑛 − 1)𝑠 2

Invirtiendo cada uno de los términos de las desigualdades, se invierte el sentido de


(𝑛−1)𝑠2 (𝑛−1)𝑠2
estas, quedando 𝑝 = ( 2 < 𝜎2 < 2 )= 1−𝛼
𝑥𝛼⁄2
𝑥1−𝛼⁄
2

Se obtiene, de esta forma, el intervalo de confianza del (𝛼 − 1) ∗ 100% para la


varianza:

(𝑛 − 1)𝑠 2 (𝑛 − 1)𝑠 2
𝐼=( ; 2 )
𝑥𝛼2⁄ 𝑥1−𝛼⁄
2 2

16
Ejemplos resueltos
1) En una prueba efectuada a 25 animales de una determinada especie, cuya
población está distribuida normalmente, se obtuvo una media de 82 y una
desviación típica muestral de 0,85. Vamos a construir un intervalo de
confianza del 90% para la varianza de la población.

Datos:

 𝑠 2 = 0,852 = 0,7225
𝛼 𝛼
 𝛼 = 0,10 ; = 0,0 5 𝑦 1 − 2 = 0,95
2

Las tablas de la 𝑥 2 𝑝𝑎𝑟𝑎 24 𝑔. 𝑙. 𝑦 𝛼 = 0,05, 𝑛𝑜𝑠 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖𝑜𝑛𝑎 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠

2 2
 𝑥0,05;24 = 36,415 𝑦 𝑥0,95;24 = 1,3848

El intervalo de confianza para 𝜎 2 vendrá dado, por consiguiente, por:

24 ∗ 0,7225 24 ∗ 0,7225
𝐼=( ; )
36,415 13,848

𝐼 = (0,47 ; 1,25)

Si extraemos las raíces cuadradas de los extremos del intervalo, se obtiene un


intervalo de para la desviación típica 𝜎:

𝐼 = (0,68 ; 1,11)

17
2) En 16 vueltas de trote, el consumo de energía de una persona experimental
tuvo una desviación estándar de 3.4. Construir un intervalo de confianza del
95% para la varianza y para la desviación estándar esperadas de la energía
de la persona.

Datos:

Suponiendo que los datos pueden considerarse como una muestra aleatoria tomada
de una población normal, usamos n = 16 y s=3.4. Ahora necesitamos los valores de
Chi cuadrada para el caso específico.

Por lo que el intervalo de confianza para la varianza estará dado por

15 ∗ (3.4)2 15 ∗ (3,4)2
𝐼=( < 𝜎2 < )
32,8 4,6

Es decir:

𝐼 = (5,28 < 𝜎 2 < 37,6)

Y, por lo tanto, el intervalo de confianza para la desviación estándar seria:

𝐼 = (√5,28 < 𝜎 2 < √37,6)

𝐼 = (2,29 < 𝜎 < 6,13).

18
Ejercicios propuestos
1) Una muestra de 26 personas seleccionadas al azar de una población de un
barrio tiene una media salarial de 1800 euros y una varianza de 6 10.000 euros.
Estime la varianza salarial en el barrio a un nivel confianza de 90.
2) Se desea estimar la demanda diaria de un producto que registra una empresa.
Para ello se seleccionan 10 días al azar con los siguientes valores en miles 35,
44, 38, 55, 33, 56, 67, 45, 48, 40. Obtenga el intervalo de confianza para la
varianza un nivel de confianza del 90 %.
3) Una agencia de alquiler de automóviles necesita estimar el número medio de
kilómetros diarios que realiza su flota de automóviles; a tal fin, a lo largo de
varios días, se anotan los recorridos de cien vehículos de su flota y obtiene que
la media muestral es de 165km/día y que la desviación muestral es 6km/día.
Hallar un intervalo de confianza al 90 % para la varianza de dicha distribución.
4) Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de
pasto distribuidas por cierta empresa: 46.4, 46.1, 45.8, 47.0, 46.1. 45.9, 45.8,
46.9, 45.2 y 46.0. Calcule un intervalo de confianza del 95% para la varianza
de todos los pesos de este tipo de paquetes de semillas de pasto distribuidos
por la empresa. Suponga una población normal.
5) Los datos adjuntos sobre voltaje de ruptura de circuitos eléctricamente
sobrecargados se tomaron de un diagrama de probabilidad normal que apareció
en un artículo “. La linealidad del diagrama apoyó de manera firme la suposición
de que el voltaje de ruptura está aproximadamente distribuido en forma normal.
1470 1510 1690 1740 1900 2000 2030 2100 2190
2200 2290 2380 2390 2480 2500 2580 2700

19
Intervalo de confianza para la proporción
Sea p la proporción de “éxitos” en una población, donde éxito identifica a un
individuo u objeto que tiene una propiedad específica (p. ej., individuos que se
graduaron en una universidad, computadoras que no requieren servicio de garantía,
etc.). Una variable aleatoria de n individuos que tiene que ser seleccionada y X es el
número de éxitos en la muestra.
El porcentaje de productos defectuosos de unos procesos de manufactura es el
barómetro más importante para medir la calidad del proceso para manufacturar un
producto dado, ya que un artículo puede estar defectuoso o no, el número de
unidades defectuosas es una variable aleatoria binomial, si se supone una
probabilidad constante e independencia. En una muestra aleatoria de tamaño n el
parámetro p que representa la proporción de artículos defectuosos es desconocido.
Se desea determinarse un intervalo de confianza para p. A pesar de que es posible
determinar intervalo de confianza exactos para p, se optara por un intervalo de
confianza basado en una muestra grande. La razón de esta decisión tiene sus raíces
en el teorema 5.1 el cual establece que:
Teorema 5.1: Sea X una variable aleatoria binomial con media no y desviación
estándar √𝑛𝑝(1 − 𝑝). La distribución de la variable aleatoria tiende al normal
estándar conforme el número de ensayos independientes 𝑛 → ∞.
𝑋−𝑛𝑝
𝑌=
√𝑛𝑝(1−𝑝)

Deseamos ahora estimar la proporción p con la que una determinada característica


se da en una población. Para ello extraemos una muestra de tamaño n y obtenemos
la proporción muestral, es decir,

𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑜𝑠 𝑞𝑢𝑒 𝑐𝑢𝑚𝑝𝑙𝑒𝑛 𝑙𝑎 𝑐𝑎𝑟𝑎𝑐𝑡𝑒𝑟𝑖𝑠𝑡𝑖𝑐𝑎


𝑝̂ =
𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

Como vimos en el tema anterior, la distribución de las proporciones muestrales es:


𝑝𝑞
𝑝̂ → 𝑁(𝑝, √ 𝑛 )

Donde q=1-p

20
Dando un nivel de confianza, 1 − 𝛼, y haciendo lo mismo que en el caso de la media,
se obtiene el siguiente intervalo de confianza para la proporción de la población:

𝑝̂ 𝑞̂ 𝑝̂ 𝑞̂
𝐼 = (𝑝̂ − 𝑧𝛼⁄2 ∗ √ , 𝑝̂ + 𝑧𝛼⁄2 ∗ √ )
𝑛 𝑛

Error máximo admisible y tamaño de la muestra


Los conceptos y notas a tener en cuenta son los mismos que en los intervalos de
confianza para la media, con los cambios obvios en las fórmulas correspondientes.

𝑝̂𝑞̂
En cuanto al error: 𝐸𝐸 = 𝑧𝛼⁄2 ∗ √ 𝑛

Y en cuanto al tamaño de la muestra

2
𝑝̂ 𝑞̂ 𝑝̂ 𝑞̂ 𝐸𝐸 𝑝̂ 𝑞̂ 𝐸𝐸
𝐸𝐸 = 𝑧𝛼⁄2 ∗ √ → √ = → =( ) →
𝑛 𝑛 𝑧𝛼⁄2 𝑛 𝑧𝛼⁄2

𝑝̂ 𝑞̂ 𝑧𝛼⁄2 2
𝑛= 2 → 𝑛 = 𝑝̂ 𝑞̂ ∗ ( )
𝐸𝐸
𝐸𝐸
(𝑧 )
𝛼⁄
2

21
Ejemplos resueltos
1) En una muestra aleatoria de n = 500 familias que tienen contratado vtr en la
ciudad de Santiago, chile, se encuentra que x = 340 están suscritas a Netflix.
Calcule un intervalo de confianza del 95% para la proporción real de familias
que tienen contratado vtr en esta ciudad y están suscritas Netflix.
Datos:
La estimación puntual de 𝑝 𝑒𝑠 𝑝̂ = 340⁄500 = 0,68. Si usamos la tabla normal

encontramos que 𝑧0,025 = 1,96. Por lo tanto, el intervalo de confianza del 95%
para p es

𝑝̂ 𝑞̂ 𝑝̂ 𝑞̂
𝐼 = (𝑝̂ − 𝑧𝛼⁄2 ∗ √ , 𝑝̂ + 𝑧𝛼⁄2 ∗ √ )
𝑛 𝑛

0,68 ∗ 0,32 0,68 ∗ 0,32


𝐼 = (0,68 − 1,96 ∗ √ , 0,68 + 1,96 ∗ √ )
500 500

𝐼 = (0,639 ; 0,7209)

∴ la proporción real de familias que tienen contratado vtr en esta ciudad y están
suscritas a Netflix se encuentra entre los 0,639 y 0,7209 con un nivel de confianza
del 95%.

22
2) Tomando al azar una muestra de 300 personas mayores de 15 años en una
gran ciudad, que se encuentra que 104 de ella leían el periódico
habitualmente. Hallar, con un nivel de confianza del 90% un intervalo para
estimar la proporción de lectores de periódico entre los habitantes de esa
ciudad mayores de 15 años.
Datos:
104
La proporción muestral es: 𝑝̂ = 300 = 0,347

El valor crítico para un nivel de confianza del 90%:


1 − 𝛼 = 0,90 → 𝛼 = 0,1 → 𝛼⁄2 = 0,05 → 1 − 𝛼⁄2 = 0,95

Luego 𝑧𝛼⁄2 = 1,64

𝑝̂∗𝑞̂ 𝑝̂∗𝑞̂
Luego sustituyendo en la fórmula: 𝐼 = (𝑝̂ − 𝑧𝛼⁄2 ∗ √ , 𝑝̂ + 𝑧𝛼⁄2 ∗ √ )
𝑛 𝑛

0,347 ∗ 0,653 0,347 ∗ 0,653


𝐼 = (0,347 − 1,64 ∗ √ , 0,347 + 1,64 ∗ √ )
300 300

Luego intervalo pedido es 𝐼𝐶90


𝐼 = (0,302 ; 0,392)

∴ Los lectores de periódico entre los habitantes de esa ciudad mayores de 15 años
se encuentran entre los 0,302 y 0,392 con un nivel de confianza del 90%.

23
Ejercicios propuestos
1) Un fabricante asegura, a una compañía que le compra un producto en forma
regular, que el porcentaje de productos no defectuosos es mayor del 45%. La
compañía decide comprobar la afirmación del fabricante seleccionando, de su
inventario 300 unidades de este producto y probándolas. ¿Deberá sospechar la
compañía de la afirmación del fabricante si se descubren un total de 34 unidades
no defectuosas en la muestra?
2) Una empresa dedicada a la venta de palomitas compra el maíz directamente a
los agricultores. Antes de efectuar la compra, un agente de la compañía quiere
estimar la probabilidad de que el grano de maíz se abra al freírlo. Ha realizado
un estudio sobre una pequeña muestra de 60 granos, de los que 48 sea abrían.
¿Cuántos granos deberá examinar para estar seguro al nivel del 90% de que el
error que cometa no superará el 1%?
3) ¿De qué tamaño habría que elegir una muestra para estimar la proporción de
alumnos del instituto que le gusta el futbol con un nivel de confianza del 95% y
un error inferior a 0,05, si una muestra de 10 alumnos, 6 de ellos respondieron
que le gustaba el futbol?
4) Se pregunto a 80 pacientes si habían sufrido algún trastorno tras seguir un
tratamiento, de los cuales 60 dijeron que no. La muestra es grande y no
esperamos que el porcentaje real en caso de haber sido extendido a muchos mas
pacientes sea muy diferente. Por lo tanto, el error estándar es:

24
Intervalo de confianza para las diferencias de medias
Si tenemos dos poblaciones con medias 𝜇1 𝑦 𝜇2, varianzas 𝜎1 𝑦 𝜎2, respectivamente,
el estadístico que da un estimador puntual de la diferencia entre 𝜇1 𝑦 𝜇2 es 𝑥̅1 − 𝑥̅2 .
Por lo tanto, para obtener una estimación puntual de 𝜇1 − 𝜇2 , se seleccionan dos
muestras aleatorias independientes, una de cada población, de tamaños 𝑛1 𝑦 𝑛2 , se
calcula 𝑥̅1 − 𝑥̅ 2 , la diferencia de las medias muestrales. Evidentemente, debemos
considerar la distribución muestral de 𝑥̅1 − 𝑥̅2 .

Intervalo de confianza para la diferencia de media con varianza conocidas pero


diferentes, 𝜎1 ≠ 𝜎2
Si las varianzas poblaciones son conocidas y diferentes, los pasos a seguir para
encontrar el intervalo de confianza son los siguientes:

a) El estadístico usado como estimador puntual de la diferencia de media 𝜇1 −


𝜇2 , será 𝑇 = 𝑥̅1 − 𝑥̅2 , que es un estimador suficiente.
b) La variable aleatoria asociada con el estimador será la variable normal
𝑥̅ 1 −𝑥̅ 2 −(𝜇1 −𝜇2)
estándar dada por: 𝑧 =
𝜎 2𝜎 2
√ 1+ 2
𝑛1 𝑛2

c) Para calcular el intervalo de confianza se debe tener en cuenta el nivel de


confianza que se quiere considerar.

Teorema: si 𝑥̅1 − 𝑥̅2 son las medias de dos muestras aleatorias independientes
de tamaño 𝑛1 𝑦 𝑛2 tomadas de poblaciones que tienen varianzas conocidas
𝜎12 𝑦𝜎22 , respectivamente, entonces el intervalo de confianza para 𝜇1 − 𝜇2 :

𝜎12 𝜎22 𝜎12 𝜎22


𝑥̅1 − 𝑥̅ 2 − 𝑧 ∗ √ + ≤ 𝜇1 − 𝜇2 ≤ 𝑥̅1 − 𝑥̅ 2 + 𝑧 ∗ √ +
𝑛1 𝑛2 𝑛1 𝑛2

25
Ejemplos resueltos
1) Construya un intervalo de confianza del 94% para la diferencia real entre las
duraciones de dos marcas de focos, si una muestra de 40 focos tomada al azar
de la primera marca dio una duración media de 418 horas, y una muestra de 50
focos de otra marca dieron una duración media de 402 horas. Las desviaciones
estándares de las dos poblaciones son 26 horas y 22 horas, respectivamente.

Datos:

𝑥̅1 = 418, 𝑥̅2 = 402, 𝜎1 = 26, 𝜎2 = 22, 𝑛1 = 40, 𝑛2 = 50 𝑦 𝑧 = 1,88

El intervalo de confianza es, entonces:

𝜎12 𝜎22 𝜎12 𝜎22


𝐼 = (𝑥̅1 − 𝑥̅2 − 𝑧 ∗ √ + ≤ 𝜇1 − 𝜇2 ≤ 𝑥̅1 − 𝑥̅2 + 𝑧 ∗ √ + )
𝑛1 𝑛2 𝑛1 𝑛2

262 222
𝐼 = ((418 − 402) − 1,88 ∗ √ + ≤ 𝜇1 − 𝜇2
40 50

262 222
≤ 418 − 402) + 1,88 ∗ √ + )
40 50

𝐼 = (6,3 ≤ 𝜇1 − 𝜇2 ≤ 25,7)

El intervalo de confianza es entre 𝐼 = (6,3 ; 25,7)

∴ La diferencia real entre las duraciones de dos marcas de focos se encuentra


entre los intervalos 6,3 y 25,7 con un nivel de confianza del 94%.

26
2) Se llevo a cabo un experimento donde se compararon dos tipos de motores, el
A y el B. Se midió el rendimiento de combustible en millas por galón. Se realizaron
50 experimentos con el motor tipo A y 75 con el motor tipo B. La gasolina utilizada
y las demás condiciones se mantuvieron constantes. El rendimiento promedio de
gasolina para el motor A fue de 36 millas por galón y el promedio para el motor
B fue de 42 millas por galón. Calcule un intervalo de confianza del 96% sobre
𝜇1 − 𝜇2 , donde 𝜇1 𝑦 𝜇2 corresponden a la media de la población del rendimiento
de millas por galón para los motores A y B, respectivamente. Suponga que las
desviaciones estándar de la población son 6 y 8 para los motores A y B,
respectivamente.
Datos:
La estimación puntual de 𝜇1 − 𝜇2 es 𝑥̅1 − 𝑥̅ 2 = 42 - 36 = 6. Si usamos α = 0.04,
obtenemos 𝑧0,02 = 2.05 de la tabla normal. Por lo tanto, sustituyendo en la
formula anterior, el intervalo de confianza del 96% es

𝜎12 𝜎22 𝜎12 𝜎22


𝐼 = (𝑥̅1 − 𝑥̅2 − 𝑧 ∗ √ + ≤ 𝜇1 − 𝜇2 ≤ 𝑥̅1 − 𝑥̅2 + 𝑧 ∗ √ + )
𝑛1 𝑛2 𝑛1 𝑛2

64 36 64 36
𝐼 = (42 − 36 − 2,05 ∗ √ + ≤ 𝜇1 − 𝜇2 ≤ 42 − 36 + 2,05 ∗ √ + )
75 50 75 50

𝐼 = (3,43 ≤ 𝜇1 − 𝜇2 ≤ 8,57)

Entonces el intervalo de confianza es 𝐼 = (3,43 ; 8,57)

27
Ejercicios propuestos
1) El gasto diario en llamadas telefónicas de dos departamentos X e Y de una
misma empresa sigue una distribución normal, con gasto medio desconocido
en ambos. Sin embargo, se conocen las desviaciones típicas, que son 100 y
110 céntimos de euro para X e Y, respectivamente. La dirección ha observado
que una muestra aleatoria de 20 días, el gasto medio diario en llamadas
realizadas por el departamento X ha sido de 1100 céntimos, y de 1400 en el
departamento Y. obtener un intervalo de confianza para la diferencia de
gastos entre ambos departamentos.

2) Se llevan a cabo pruebas de resistencia a la tensión sobre dos diferentes


clases de largueros de aluminio utilizados en la fabricación de aviones
comerciales pequeños. De la experiencia pasada con el proceso de fabricación
de largueros y del procedimiento de prueba, se supone que la desviación
estándar de las resistencias a la tensión es conocida. Los datos obtenidos
aparecen en la siguiente tabla:

Clase de Tamaño de la Media muestral de la Desviación estándar de la


larguero muestra resistencia a la tensión ( población ( Kg/mm2)
Kg/mm2)
1 10 87,6 1,0
2 12 74,5 1,5
En base a esta información entregada previamente, encuentre un intervalo de
confianza para la diferencia entre los promedios poblacionales de la resistencia a la
tensión con un nivel de confianza del 90%.

3) Un consumidor de cierto producto quiere aplicar la técnica de estimación


estadística para decidir si comprar la marca A o la marca B del producto. Para
esto va a estimar la diferencia entre los tiempos de vida promedio de las dos
marcas del producto. Si dos muestras aleatorias independientes de 10
unidades de cada marca llevados a un laboratorio han dado las medias de

28
vida útil respectiva de 1230 horas y 1190 horas; ¿es acertada la decisión del
consumidor si decide adquirir la marca a? Aplique el nivel de confianza del
95% y suponga que las dos poblaciones tienen distribución normal con
desviaciones estándar respectivamente de 120 y 160 horas.
4) El salario diario promedio para una muestra de 𝑛1 = 30 empleados de una
empresa manufacturera grande es 𝑥1 = $28000 con una desviación estándar
de 𝑠1 = $1400, en otra empresa grande, una muestra aleatoria de 𝑛2 = 40
empleados tiene un salario promedio diario de 𝑥2 = $27000, con desviación
estándar muestral de 𝑠2 = $1000. El intervalo de confianza del 99% para
estimar las diferencias entre los niveles diarios de salarios en las dos
empresas es:

29
Intervalo de confianza para la diferencia de media con varianza desconocidas pero
iguales, 𝜎12 = 𝜎22 = 𝜎 2
Cuando las varianzas son desconocidas, se debe realizar previamente una prueba
estadística para verificar si éstas son iguales o diferente s. Para hacerlo debemos hace
r uso de la distribución F, bien sea mediante el cálculo de la probabilidad de que la
muestra tomada provenga de dos poblaciones con varianzas iguales, o mediante el uso
de un intervalo de confianza para la relación de dos varianzas, según se estudiará más
adelante. Como se desconocen las varianzas de la población, se usa n las varianzas de
las muestras como estimadores. El procedimiento por seguir para el cálculo del intervalo
de confianza para la diferencia de dos medias será el siguiente:

a) El estadístico usado como estimador puntual de la diferencia de medias 𝜇1 − 𝜇2 será


𝑥1 − 𝑥2 , que es un estimador suficiente.
b) La variable aleatoria asociada con el estimador será la variable definida como (se
𝑥̅1 −𝑥̅2 −(𝜇1 −𝜇2 )
usa t en caso de muestras pequeñas): 𝑡 = 1 1
𝑠𝑝 √ +
𝑛1 𝑛2

c) Donde 𝑠𝑝 es un estimador combinado de las 𝑠 2 , “mejor” que 𝑠12 , 𝑠22 por separado,
(𝑛1 −1)𝑠12 +(𝑛2 −1)𝑠22
donde 𝑠𝑝2 = 𝑛1 +𝑛2 −2

d) Para calcular el intervalo de confianza se debe tener en cuenta el nivel de confianza


que se quiere considerar y los grados de libertad que se calculan 𝑔. 𝑙. = 𝑛1 + 𝑛2 − 2

De nuevo, manipulando la expresión anterior en forma similar al caso previo se llega al


siguiente teorema que nos define el intervalo de confianza para la diferencia entre dos
medias 𝜇1 − 𝜇2 con varianzas desconocidas pero iguales.

Teorema: Si 𝑥1 , 𝑥2 , 𝑠12 , 𝑠22 son las medias y las varianzas de dos muestras aleatorias de
tamaños 𝑛1 , 𝑛2 , respectivamente, tomadas de dos poblaciones normales e
independientes con varianzas desconocidas pero iguales, entonces un intervalo de
confianza para la diferencia entre medias 𝜇1 − 𝜇2 :

𝑥̅1 − 𝑥̅2 − 𝑡 ∗ 𝑠𝑝 ∗ √1⁄𝑛1 + 1⁄𝑛2 ≤ 𝜇1 − 𝜇2 ≤ 𝑥̅1 − 𝑥̅2 + 𝑡 ∗ 𝑠𝑝 ∗ √1⁄𝑛1 + 1⁄𝑛2

30
Ejercicios resueltos
1) La siguiente tabla representa los resultados de dos muestras aleatorias para
comprar el contenido de nicotina de dos marcas de cigarrillos.
Marca A Marca B
𝑛𝑖 10 8
𝑥̅𝑖 3,1 2,7
𝑠𝑖 0,5 0,7
Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de
poblaciones normales con varianzas desconocidas e iguales, construya su intervalo
de confianza del 95% para la diferencia real de nicotina de las dos marcas.

Datos: Como la varianza son iguales, calculamos 𝑠𝑝2 que este dado por:

(𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22


𝑠𝑝2 =
𝑛1 + 𝑛2 − 2

(10 − 1) ∗ 0,52 + (8 − 1) ∗ 0,7^2


𝑠𝑝2 =
10 + 8 − 2

(9) ∗ 0,52 + (7) ∗ 0,72


𝑠𝑝2 =
16

𝑠𝑝 = 0,596

1 1 1 1
𝐼 = 𝑥̅1 − 𝑥̅2 − 𝑡 ∗ 𝑠𝑝 ∗ √ + ≤ 𝜇1 − 𝜇2 ≤ 𝑥̅1 − 𝑥̅2 + 𝑡 ∗ 𝑠𝑝 ∗ √ +
𝑛1 𝑛2 𝑛1 𝑛2

1 1
𝐼 = 3,1 − 2,7 − 2,21 ∗ 0,596 ∗ √ + ≤ 𝜇1 − 𝜇2
10 8

1 1
≤ 3,1 − 2,7 + 2,21 ∗ 0,596 ∗ √ +
10 8

𝐼 = −0,2 ≤ 𝜇1 − 𝜇2 ≤ 1,0

∴ La diferencia real de nicotina de las dos marcas esta entre -0,2 y 1,0 con 95%

31
2) Queremos estudiar la influencia que puede tener el tabaco con el peso de los
niños al nacer. Para ello se consideran dos grupos de mujeres embarazadas
(unas que fuman y otras que no) y se obtienen los siguientes datos sobre el
peso X, de sus hijos:

Madres fumadoras 𝑛1 = 35 𝑚𝑢𝑗𝑒𝑟𝑒𝑠; 𝑥̅1 = 3,6𝐾𝑔; 𝑠̂1 = 0,5𝐾𝑔

Madres no fumadoras 𝑛2 = 27 𝑚𝑢𝑗𝑒𝑟𝑒𝑠; 𝑥̅2 = 3,2𝐾𝑔; 𝑠̂1 = 0,8𝐾𝑔

En ambos grupos los pesos de los recién nacidos provienen de sendas


distribuciones normales de medias desconocidas, y con varianzas que, si bien
son desconocidas, podemos suponer que son las mismas. Calcular en cuanto
influyen el que la madre sea fumadora en el peso de su hijo.

(𝑛1 −1)𝑠̂12 +(𝑛2 −1)𝑠̂22


Solución: 𝑠̂ 2 = 𝑛1 −𝑛2 −2

(35 − 1) ∙ 0,5^2 + (27 − 1) ∙ 0,8^2


𝑠̂ 2 =
35 − 27 − 2

34 ∙ 0,52 + 27 ∙ 0,82
𝑠̂ 2 =
60

𝑠̂ 2 = 0,49

𝑠̂ = 0,6473

Consideramos un nivel de significación que nos parezca aceptable, por ejemplo


𝛼 = 0,5, y el intervalo buscado se obtiene a partir de:

|(3,6 − 3,2) − (𝜇1− 𝜇2 )|


≤ 𝑡60;1−0,05⁄ = 𝑡60;0,975 = 2
1 1 2
0,6473 ∙ √35 + 27

→ 𝜇1 − 𝜇2 = 0,4 ± 2 ∙ 0,1658 → 𝜇1 − 𝜇2 = 0,4 ± 0,3316

Con lo cual se puede decir que un intervalo de confianza para el peso esperado
en que supera un hijo de madre no fumadora al otro de madre fumadora está
comprendido con un nivel de confianza del 95% entre los 0,068Kg y los 0,731Kg.

32
Ejercicios propuestos
1) Se piensa que los estudiantes de licenciatura de contaduría pueden superar
un mayor salario promedio al egresar de la licenciatura, que el que esperan
los estudiantes de administración. Recientemente se obtuvieron muestras
aleatorias de ambos grupos de un área geográfica relativamente homogénea,
proporcionando los datos que se encuentran en la siguiente tabla:

Contadores Administradores
$16300 $13200
$18200 $15100
$17500 $13900
$16100 $14700
$15900 $15600
$15400 $15800
$15800 $14900
$17300 $18100
$14900 $15600
$15100 $15300
$16200
$15200
$15400
$16600
Determinar un intervalo de confianza unilateral inferior del 90% para la diferencia
entre los entre los salarios promedios para los estudiantes de contaduría y los de
administración 𝜇𝐴 − 𝜇𝑀 al egresar de la licenciatura (suponga que las varianzas
𝜎𝐴2 𝑦 𝜎𝑀
2
son iguales).

33
2) En el artículo “Estructura comunitaria de los macroinvertebrados como un
indicador de la contaminación de minas acidas”, publicado en el Journal of
Environmental Pollution, se informa sobre una investigación realizada en Cane
Creek, Alabama, para determinar la relación entre parámetros fisicoquímicos
seleccionados y diversas mediciones de la estructura de la comunidad de
macroinvertebrados. Una faceta de la investigación consistió en evaluar la
efectividad de un indice numérico de la diversidad de especies para indicar la
degradación del agua debida al desagüe acido de una mina.
Conceptualmente, un indice elevado de la diversidad de especies
macroinvertebradas debería indicar un sistema acuático no contaminado;
mientras que un indice bajo de esta diversidad indicaría un sistema acuático
contaminado.
Se eligieron 2 estaciones de muestreo independientes para este estudio: una
que se localiza corriente abajo del punto de descarga acida de la mina y la
otra ubicada corriente arriba. Para 12 muestras mensuales reunidas en la
estación corriente abajo el indice de diversidad de especies tuvo un valor
medio de 𝑥̅1 = 3.11 y una desviación estándar de 𝑠̂1 = 0.771; mientras que 10
muestras reunidas mensualmente en la estación corriente arriba tuvieron un
valor medio del indice 𝑥̅2 = 2.04 y una desviación estándar de 𝑠̂2 = 0,448.
Calculemos un intervalo de confianza del 90% para la diferencia entre las
medias de la población de los dos sitios, suponiendo que las poblaciones se
distribuyen de forma aproximadamente normal y que tienen varianzas
iguales.
3) El agente de una cadena de restaurantes va a decidir adquirir entre dos
variedades de arroz A y B. Para tomar la decisión estadística comparando la
calidad, se escogieron dos muestras aleatorias independientes de 10 bolsas
de arroz de un kilo cada una de las dos variedades de arroz y se observaron
los siguientes porcentajes de granos quebrados por kilo:

34
1 2 3 4 5 6 7 8 9 10
Variedades: A 6 5 6 7 4 7 6 4 3 6
Variedades: B 7 6 7 9 5 8 7 6 10 8

4) La vida útil promedio de una muestra aleatoria de 𝑛1 = 10 focos es 𝑥̅1 = 4600


horas con 𝑠1 = 250 horas. Para otra marca de focos, la vida útil promedio y la
desviación estándar para una muestra de 𝑛2 = 8 focos son 𝑥̅2 = 4000 horas y
𝑠2 = 200 horas. Se asume que la vida útil de los focos de ambas marcas tiene
una distribución normal. El intervalo de confianza del 90% para estimar la
diferencia entre las vidas útiles promedio de las dos marcas de focos es.

35
Intervalo de confianza para la diferencia de media con varianza desconocidas pero
diferentes, 𝜎12 ≠ 𝜎22 ≠ 𝜎 2
a) El estadístico usado como estimador puntual de la diferencia de medias 𝜇1 −
𝜇2 , será 𝑥̅1 − 𝑥̅2 , que es un estimador suficiente
b) La variable aleatoria asociada con el estimador será la variable t definida
𝑥̅ 1 −𝑥̅ 1 −(𝜇1 −𝜇2 )
como: 𝑡 =
𝑠 2𝑠 2
√ 1+ 2
𝑛1 𝑛2

c) El intervalo de confianza esta dado por el siguiente teorema, basado en la


distribución t con n grados de libertad.
Teorema. Si 𝑥1 , 𝑥2 , 𝑠12 , 𝑠22 son las medias y las varianzas de dos muestras
aleatorias de tamaños 𝑛1 , 𝑛2 , respectivamente, tomadas de dos poblaciones
normales e independientes con varianzas desconocidas y diferentes, entonces
un intervalo de confianza para la diferencia entre medias 𝜇1 , 𝜇2 es
(nuevamente para el caso de muestras pequeñas):

𝑠12 𝑠22 𝑠12 𝑠22


𝑥̅1 − 𝑥̅2 − 𝑡√ + ≤ 𝜇1 − 𝜇2 ≤ 𝑥̅1 − 𝑥̅ 2 + 𝑡√ +
𝑛1 𝑛2 𝑛1 𝑛2

𝑠2 𝑠 2 2
( 1+ 2)
𝑛1 𝑛2
Los grados de libertad están dados por: 𝑣 = 2 2
𝑠2 𝑠2
( 1) ( 2)
𝑛1 𝑛2
+
𝑛1 −1 𝑛2 −1

( ) ( )

Nota:
El valor obtenido se redondea al entero más próximo.
Si llevamos a cabo un cálculo de intervalo de confianza para diferencia
de medias, suponiendo que las varianzas no son iguales, en el dado
caso que, si lo fueran, perderíamos muy poco, y el intervalo obtenido
sería un poco conservador.
El caso de que supongamos que las varianzas son iguales siendo que
no lo son, nos produce un error mayor que pueda ser considerable por
lo que una sugerencia es usar diferentes como la regla general.

36
Ejemplos resueltos
1) Cierto metal se produce, por lo común, mediante un proceso estándar. Se
desarrolla un nuevo proceso en el que se añade una aleación a la producción
del metal. Los fabricantes se encuentran interesados en estimar la verdadera
diferencia entre las tensiones de ruptura de los metales producidos por los
dos procesos. Para cada metal se seleccionan 12 ejemplares y cada uno de
estos se somete a una tensión hasta que se rompe.
La siguiente tabla muestra las tensiones de ruptura de los ejemplares en
kilogramos por centímetro cuadrado:
Proceso 446 401 476 421 459 438 481 411 456 427 459 445
estándar
Proceso 462 448 435 465 429 472 453 459 427 468 452 447
nuevo

Si se supone que el muestreo se llevó a cabo sobre dos distribuciones


normales e independientes, obtener los intervalos de confianza estimados del
95% y 99% para la diferencia entre los dos procesos.
Interprete los resultados.
Solución:
Calculamos los valores que necesitamos.
n Media S
12 443.3 24.8
12 451.4 14.9

2
𝑠2 𝑠2
(𝑛1 + 𝑛2 )
1 2
𝑣= 2
𝑠2 2 2
𝑠
( 1) ( 2)
𝑛1 𝑛2
(𝑛 ) + (𝑛 )
1 −1 2 −1

37
2
24.82 14.92
( + )
12 12
𝑣= 24.8 2 14.9 2
= 18
( ) ( )
12 12
( 12−1 ) + ( 12−1 )

95% de confianza con 𝑡1 = 2,10; 𝑡2 = −2,10

𝑠12 𝑠22 𝑠12 𝑠22


𝑥̅1 − 𝑥̅2 − 𝑡√ + ≤ 𝜇1 − 𝜇2 ≤ 𝑥̅1 − 𝑥̅ 2 + 𝑡√ +
𝑛1 𝑛2 𝑛1 𝑛2

Por lo tanto:

14,92 24,82
(451,4 − 443,3) − 2,10√ + ≤ 𝜇1 − 𝜇2
12 12

14,92 24,82
≤ (451,4 − 443,3) + 2,10 √ +
12 12

25,65 ≤ 𝜇1 − 𝜇2 ≤ 9,49
∴ por lo tanto, la verdadera diferencia entre las tensiones de ruptura de los
metales producidos por los dos procesos se encuentra entre los valores
25,65 ; 9,49 con un intervalo de confianza del 95%.
Y para 99% de confianza con 𝑡1 = 2,88; 𝑡2 = −2,88

14,92 24,82
(451,4 − 443,3) − 2,88√ + ≤ 𝜇1 − 𝜇2
12 12

14,92 24,82
≤ (451,4 − 443,3) + 2,88√ +
12 12

−32,16 ≤ 𝜇1 − 𝜇2 ≤ 15,99

∴ por lo tanto, la verdadera diferencia entre las tensiones de ruptura de los


metales producidos por los dos procesos se encuentra entre los valores
−32,16 ; 15,99 con un intervalo de confianza del 99%.

38
2) El Departamento de zoología de Virginia Tech llevo a cabo un estudio para
estimar la diferencia en la cantidad de orto fosforo químico medido en dos
estaciones diferentes del rio James. El orto fosforo se mide en miligramos por
litro. Se reunieron 15 muestras de la estación 1 y 12 muestras de la estación
2. Las 15 muestras de la estación 1 tuvieron un contenido promedio de orto
fosforo de 3.84 miligramos por litro y una desviación estándar de 3.07
miligramos por litro; en tanto que las 12 muestras de la estación 2 tuvieron
un contenido promedio de 1.49 miligramos por litro y una desviación estándar
de 0.80 miligramos por litro. Calcule un intervalo de confianza de 95% para
la diferencia en el contenido promedio verdadero de orto fosforo en estas dos
estaciones. Suponga que las observaciones provienen de poblaciones
normales con varianzas diferentes.
n Media S
15 3,84 3,07
12 1,49 0,80
Queremos obtener un intervalo de confianza del 95% para 𝜇1 − 𝜇2 .
Como se suponen varianzas de la población diferentes, solo podemos calcular
un intervalo de confianza aproximado del 95% basado en la distribución t con
v grados de libertad, donde
2
𝑠2 𝑠2
(𝑛1 + 𝑛2 )
1 2
𝑣= 2
𝑠2 𝑠 2 2
( 1) ( 2)
𝑛1 𝑛2
(𝑛 ) + (𝑛 )
1 −1 2 −1

3,07^2 0,80^2 2
( + )
15 12
𝑣= 3,07^2 2 0,80^2 2
= 16,3 ≈ 16
( 15 ) ( 12 )
( 15−1 )+ ( 12−1 )

Nuestra estimación puntual de 𝜇1 − 𝜇2 es


𝑥̅1 − 𝑥̅2 = 3,84 − 1,49 = 2,35

39
Si usamos 𝛼 = 0,05, en la tabla encontramos que 𝑡0,025 = 2,120 𝑝𝑎𝑟𝑎 𝑣 = 16
grados de libertad. Por lo tanto, el intervalo de confianza del 95% para 𝜇1 −
𝜇2 es

𝑠12 𝑠22 𝑠12 𝑠22


𝑥̅1 − 𝑥̅2 − 𝑡 √ + ≤ 𝜇1 − 𝜇2 ≤ 𝑥̅1 − 𝑥̅ 2 + 𝑡 √ +
𝑛1 𝑛2 𝑛1 𝑛2

30,72 0,802 30,72 0,802


2,35 − 2,120√ + ≤ 𝜇1 − 𝜇2 ≤ 2,35 + 2,120√ + .
15 12 15 12

Que se simplifica a 0,60 ≤ 𝜇1 − 𝜇2 ≤ 4,10. En consecuencia, tenemos un


95% de confianza en que el intervalo de 0,60 a 4,10 miligramos por litro
contiene la diferencia del promedio verdadero del orto fósforo que contiene
estos dos lugares.
Observación: Cuando se desconocen dos varianzas de la población,
la suposición de varianzas iguales o diferentes podría ser precaria.

40
Ejercicios propuestos
1) Se lleva a cabo un estudio para comparar los montos de los préstamos
personales realizadas por dos entidades financieras A y B. con este fin se
tomaron 9 y 8 préstamos al azar de cada banco resultando los siguientes
montos en miles de soles:
1 2 3 4 5 6 7 8 9
Variedad: A 12 28 10 25 24 19 22 33 17
Variedad: B 16 20 16 20 16 17 15 21

Aplicando un intervalo de estimación del 95% para la verdadera diferencia de


los montos promedios, ¿Es válido inferir que en promedio el monto de los
préstamos del banco A es mayor a los del banco B? datos históricos indican
que la distribución de estos préstamos en cada banco es normal con varianzas
diferentes.
2) El arsénico en agua potable es un posible riesgo para la salud. Un articulo
reciente reporto concentraciones de arsénico en agua potable en partes por
billón (ppb) para 10 comunidades urbanas y 10 comunidades rurales.
Urbana 3 7 25 10 15 6 12 25 15 7
Rural 48 44 40 38 33 21 20 12 1 18
Construir un I.C del 90% para 𝜇1 − 𝜇2 . Asuma que las muestras provienen de
poblaciones normales con varianzas desconocidas y diferentes.

3) Una compañía de taxis trata de decidir si comprar neumáticos de la marca A


o de la B para su flotilla de taxis. Para estimar la diferencia entre los
promedios de desgaste a través de Kms. recorridos, de las dos marcas, se
lleva a cabo un experimento utilizando 12 de cada marca. Los neumáticos se
utilizan hasta que se desgastan, dando como resultado promedio para la
marca A 36.300 kilómetros, con una desviación estándar de 5000 kilómetros
y para la marca B 38.100 kilómetros con una desviación estándar de 6100
kilómetros. Calcule un intervalo de confianza de 95% para la diferencia

41
promedio de las dos marcas, si se sabe que las poblaciones se distribuyen de
forma aproximadamente normal para la marca A y para la marca B. Asuma
que las dos varianzas poblacionales son distintas.
4) Los pesos de 4500 estudiantes de bachillerato de una ciudad están
distribuidos normalmente con una media de 56,5 kg y una varianza de 2,5
kg. Si se seleccionan 40 muestras con reposición de 20 estudiantes cada una,
hallar la media y varianza de las distribuciones de las medias muestrales con
varianza desconocida y diferentes.

42
Intervalo de confianza para el cociente de varianzas
La necesidad de disponer de métodos estadísticos para comparar las varianzas de
dos poblaciones es evidente a partir del análisis de una sola población.
Frecuentemente se desea comparar la precisión de un instrumento de medición con
la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la
forma en que varia el procedimiento para calificar de un profesor universitario con
la de otro.

Intuitivamente, podríamos comparar las varianzas de dos poblaciones 𝜎12 𝑦 𝜎22 ,


utilizando la razón de las varianzas muestrales.

𝑠12
𝑠22

Y si es casi igual a 1, se tendrá poca evidencia para indicar que 𝜎12 𝑦 𝜎22 no son
𝑠12
iguales. Por otra parte, un valor muy grande o muy pequeño para , proporcionara
𝑠22

evidencia de una diferencia en las varianzas de las poblaciones.

Para encontrar un intervalo de confianza para el cociente de dos varianzas,


empleamos la distribución F que es similar a como hicimos en el caso de una sola
varianza empleando la distribución chi-cuadrada, solo que ahora usamos el
estadístico definido por:

𝑠12
𝜎12 𝑠12 ∙ 𝜎22 𝑠1 2 𝜎2 2
𝐹= 𝑠22
= 2 2 =( ) ∙( )
𝑠2 ∙ 𝜎1 𝑠2 𝜎1
𝜎22

Supóngase que se tiene dos poblaciones normales e independientes con varianzas


desconocidas 𝜎12 𝑦 𝜎22 , respectivamente. De este par de poblaciones, se tienen
disponibles dos muestras aleatorias de tamaños 𝑛1 𝑦 𝑛2 , respectivamente, sean
𝑠12 𝑦 𝑠22 las dos varianzas muestrales. Si se desea, por ejemplo, conocer un intervalo
𝜎12
de confianza del 95% por ciento para el cociente de las dos varianzas: 𝜎22

43
El caso de la distribución la F, para un nivel de confianza (por ejemplo, de 95%)
requiere calcular los grados de libertad del numerador y del denominador, este
ejemplo son 30 y 24 respectivamente

Para construir el intervalo de confianza para el cociente de dos varianzas


poblacionales, se coloca la varianza muestral mayor en el numerador del estadístico
𝑠 2 𝜎 2
F. 𝐹 = (𝑠1 ) ∙ (𝜎2 )
2 1

𝜎 2 𝑠 2
Despejando: (𝜎2 ) = (𝐹𝑠1 )
1 2

Esto nos permite calcular la probabilidad de que el cociente se encuentre entre dos
𝑠 2
valores de F. Para construir el intervalo de confianza empleamos entonces (𝐹𝑠1 ) <
2

𝑠 2 𝑠 2
(𝐹𝑠1 ) < (𝐹𝑠1 )
2 2

En este caso se requiere calcular los grados de libertad del numerador que son 𝑛1 −
1 (recordando que se toma a 𝑛1 como el tamaño de la muestra de la varianza mas
grande) y los del denominador que son 𝑛2 − 1.

44
Ejemplos resueltos
1) Un fabricante de automóviles pone a prueba dos nuevos métodos de
ensamblaje de motores respecto al tiempo en minutos. Los resultados se
muestran en la tabla siguiente:
Método 1 Método 2
𝑛1 = 31 𝑛2 = 31
𝑠12 = 50 𝑠22 = 24
𝜎12
Construir un intervalo de confianza del 90% para 𝜎22

Solución:
𝑠12 𝜎2 𝑠2
Sabemos que < 𝜎12 < 𝑠12
𝐹𝑠22 2 2

Tomamos a 𝑠12 como numerador porque es el valor más grande. Los valores
de F requieren los grados de libertad del numerador
𝑛1 − 1 = 30 y del denominador 𝑛2 − 1 = 24.
𝑠12 𝜎12 𝑠12
< <
𝐹𝑠22 𝜎22 𝑠22
50 𝜎12 50
< 2<
1,94 ∙ 24 𝜎2 0,53 ∙ 24
𝜎2
Por lo tanto: 1,07 < 𝜎12 < 3,93
2

Y el intervalo de confianza para el cociente de las desviaciones estándar sería:


𝜎1
1,03 < < 1,98
𝜎2

45
2) Una empresa fabrica propulsores. A los ingenieros les gustaría saber cuál de
dos procesos tiene la menor rugosidad en las superficies. Para ellos se toman
muestras aleatorias de cada proceso.
Proceso 1 Proceso 2
𝑛1 = 16 𝑛2 = 4,7
𝑠12 = 12 𝑠22 = 5,1
Solución:
Por lo que el intervalo de confianza para el cociente de varianzas estará dado
por
𝑠12 𝜎12 𝑠12
< <
𝐹𝑠22 𝜎22 𝑠22
5,12 𝜎12 5,12
< <
0,368 ∙ 4,72 𝜎22 2,51 ∙ 4,72
𝜎12
0,469 < < 3,2
𝜎22
Y para las desviaciones estándar (calculamos la raíz cuadrada):
𝜎12
0,68 < < 1,79
𝜎22
∴ Como el intervalo de confianza incluye el valor de uno, no se puede concluir
que exista alguna diferencia entre la variabilidad de los dos procesos (es decir,
el intervalo de confianza incluye la posibilidad de que las dos desviaciones
estándar sean iguales, por lo que el cociente sería igual a uno).

46
Ejercicios propuestos
1) Para probar el gasto de combustible de dos marcas de coches A y B
seleccionan al azar 9 coches de la marca A, que proporcionan a una media
de 18 Km. Recorridos por cada litro de combustible, con una cuasi varianza
1,1 km. Por litro, y otros 12 coches de la marca B, que proporcionan una
media de 15 Km. Recorridos por litro, con una cuasi varianza de 2,9 Km por
litro. Si se supone que la distancia recorrida por cada litro de combustible
sigue una distribución normal en ambas marcas, hallar un intervalo de
confianza para el cociente de varianzas.
2) Se extraen dos muestras aleatorias de tamaños 10 y 15, de dos poblaciones
distribuidas normalmente y con la misma varianza. Si 𝑠12 es la cuasi varianza
de la primera muestra, y 𝑠22 es la cuasi varianza de la segunda, hallar la
𝑠12
probabilidad de que el cociente de cuasi varianza sea menor que 5.
𝑠22

3) Las siguientes son las capacidades calóricas del carbón de dos minas (en
millones de calorías por tonelada):
Mina A 8,500 8,330 8,480 7,960 8,030
Mina B 7,710 7,890 7,920 8,270 7,860
Suponga que los datos constituyen una muestra aleatoria independientes de
poblaciones normales con varianzas iguales, construya un intervalo de
confianza del 90% para la razón de las varianzas de las dos poblaciones
muestreadas.
4) Doce arboles adultos de cítricos de cierta variedad, escogidos aleatoriamente,
tienen una media de la altura de 13,8 pies con una desviación estándar de
1,2 pies, y 15 árboles adultos de cítricos de otra variedad, escogidos
aleatoriamente, tienen una media de la altura de 12,9 pies con una desviación
estándar de 1,5 pies. Suponga que las muestras aleatorias se seleccionaron
de poblaciones normales con varianzas iguales, construya un intervalo de
confianza del 98% para la razón de las varianzas de las dos poblaciones
muestreadas

47
Intervalo de confianza para la diferencia de proporciones
Consideremos ahora dos poblaciones formadas por individuos que presentan un
carácter dicotómico, y sean 𝑝1 𝑦 𝑝2 las probabilidades respectivas de que se presente
la modalidad A del carácter dicotómico en dichas poblaciones.

Supongamos que disponemos de una muestra de tamaño 𝑛1 de la primera población


y otra de tamaño 𝑛2 de la segunda.

Designemos por 𝑝̂1 la proporción de individuos de la primera población de poseen


la modalidad A del carácter en una muestra de tamaño 𝑛1 , y designemos por 𝑝̂ 2 la
proporción de individuos de la segunda población que poseen la modalidad B del
carácter en una muestra de tamaño 𝑛2 .

Si el tamaño de las muestras es mayor que 30, el estadístico 𝑝̂1 − 𝑝̂ 2 sigue una
𝑝1 (1−𝑝1 ) 𝑝2 (1−𝑝2 )
distribución normal 𝑁 (𝑝1 − 𝑝2 , √ + )
𝑛1 𝑛2

(𝑝̂1 −𝑝̂2 )−(𝑝1 −𝑝2 )


Por lo que la variable 𝑧 = 𝑝 ∙𝑞 𝑝 ∙𝑞
1 1
√ 𝑛 + 2𝑛 2
1 2

48
Teorema: Si 𝑥1 es una variable aleatoria binomial con los parámetros 𝑛1 y 𝑝̂1,
𝑥2 es una variable aleatoria binomial con los parámetros 𝑛2 y 𝑝̂ 2 , 𝑛1 𝑦 𝑛2 son
𝑥 𝑥
grandes, y 𝑝̂1 = 𝑛1 y 𝑝̂2 = 𝑛2 , entonces
1 2

𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
(𝑝̂1 − 𝑝̂2 ) − 𝑧𝜎⁄ ∙ √ + < 𝑝1 − 𝑝2
2 𝑛1 𝑛2

𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
< (𝑝̂1 − 𝑝̂ 2 ) + 𝑧𝜎⁄2 ∙ √ +
𝑛1 𝑛2

Es un intervalo de confianza aproximado de (1 − 𝛼)100% 𝑝𝑎𝑟𝑎 𝑝1 − 𝑝2 .

49
Ejercicios resueltos
1) Para conocer la eficacia de una vacuna anticatarral, se suministra esta a una
muestra aleatoria de 50 personas. Se observa que solo 4 de ella se han
acatarrado.
Se seleccionan asimismo otra nueva muestra de 50 personas a quienes no se
les suministrara la vacuna, observando que 9 de ellas se han acatarrado.
Se trata de hacer una estimación de la diferencia de proporciones de
individuos vacunados y no vacunados de la población que sufren un catarro.
Solución:
El número de personas vacunadas sigue una binomial B(𝑝1 , 𝑛1 ) y el de
personas no vacunadas sigue una binomial B(𝑝2 , 𝑛2 ).
𝑝̂1 es un estimador de 𝑝1 y 𝑝̂ 2 es un estimador de 𝑝2 , por lo que estimación
9 4 5 1
de 𝑝1 − 𝑝2 es 𝑝̂1 − 𝑝̂2 = 50 − 50 = 50 = 10

La estimación de la desviación típica de 𝑝̂1 − 𝑝̂ 2 𝑒𝑠:

𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
𝜎𝑝1∙𝑝2 = (√ + )
𝑛1 𝑛2

9 9 4 4
(1 − 50) (1 − 50)
𝜎𝑝1 ∙𝑝2 = (√50 + 50
)
50 50

𝜎𝑝1 ∙𝑝2 = 0,066

∴La estimación de la desviación típica con respecto a la diferencia de los


individuos vacunados y no vacunados de la población es de 0,066

50
2) Si 132 de 200 votantes hombres y 90 de 159 votantes de mujeres están a
favor de cierto candidato que hace campaña para gobernar de Illinois,
encuentre un intervalo de confianza del 99% para la diferencia entre las
proporciones reales de votantes hombres y votantes mujeres que están a
favor del candidato.
Solución:
132 90
Sustituimos 𝑝̂1 = 200 = 0,66, 𝑝̂2 = 150 = 0,60 y 𝑧0,005 = 2,575 en la formula del

intervalo de confianza obtenemos

𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
(𝑝̂1 − 𝑝̂2 ) − 𝑧𝜎⁄ ∙ √ + < 𝑝1 − 𝑝2
2 𝑛1 𝑛2

𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
< (𝑝̂1 − 𝑝̂ 2 ) + 𝑧𝜎⁄2 ∙ √ +
𝑛1 𝑛2

0,66(1 − 0,66) 0,60(1 − 0,60)


(0,66 − 0,60) − 2,575 ∙ √ + < 𝑝1 − 𝑝2
200 150

0,66(1 − 0,66) 0,60(1 − 0,60)


< (0,66 − 0,60) + 2,575 ∙ √ +
200 150

0,66(0,34) 0,60(0,40)
(0,66 − 0,60) − 2,575 ∙ √ + < 𝑝1 − 𝑝2
200 150

0,66(0,34) 0,60(0,40)
< (0,66 − 0,60) + 2,575 ∙ √ +
200 150

La que se reduce a −0,074 < 𝑝1 − 𝑝2 < 0,194


Así, estamos 99% seguros de que el intervalo de -0,074 a 0,194 contiene la
diferencia entre las proporciones reales de votantes hombres y mujeres que
favorece al candidato. Observe que esto incluye la posibilidad de una
diferencia cero entre las dos proporciones.

51
Ejercicios propuestos
1) Se considera hacer un cierto cambio en el proceso de fabricación de partes
componentes. Para determinar si el cambio en el proceso da como resultado
una mejora, se toman muestras de partes fabricadas con el proceso nuevo y
con el actual. Si se encuentra que 75 de 1500 artículos manufacturados con
el proceso actual están defectuosos y 80 de 2000 manufacturados con el
proceso nuevo también lo están, calcule un intervalo de confianza del 90%
para la diferencia verdadera en la proporción de partes defectuosas entre el
proceso actual y el nuevo.
2) Entre 500 solicitudes de licencias de matrimonio escogidas aleatoriamente en
un año dado, hubieron 40 en que la mujer era al menos un año mayor que
el hombre, y entre 400 solicitudes de licencias de matrimonio escogidas
aleatoriamente seis años después, hubieron 68 en los cuales la mujer era al
menos un año mayor que el hombre. Construya un intervalo de confianza del
99% para la diferencia entre las verdaderas proporciones correspondientes
de solicitudes de licencias de matrimonio en que la mujer es al menos un año
mayor que el hombre.
3) Se cree que la osteoporosis está relacionada con el sexo. Para ello se elige
una muestra de 100 hombres de más de 50 años y una muestra de 200
mujeres en las mismas condiciones. Se obtiene que 10 hombres y 40 mujeres
con algún grado de osteoporosis. ¿Qué podemos concluir con una confianza
del 95 %?

52

You might also like