Professional Documents
Culture Documents
ESTADISTICA INFERENCIAL
DOCENTE:
MGc. KENNEDY HURTADO IBARRA
BARRANQUILLA COLOMBIA
Referencias:
Llínas, Humberto; Estadística Inferencial.
Montgomery, Douglas, Probabilidad y Estadísticas Aplicaciones y
Métodos.
Objetivos de la estimación:
• Estimación de parámetros.
• Intervalos de confianzas.
• Pruebas de hipótesis.
Definición: Distribución muestral.
P(X > 10) = P([Z > (10−µ) /σ ] = P[Z > (10−12,2)/ 1,2] = P(Z > −1,83) =
1−P(Z ≤−1,83)
Ahora, como la población es normal y la varianza poblacional es
conocida, entonces, por el teorema, la distribución muestral de la
media muestral es normal o, lo que es equivalente, la variable Z tiene
normal estándar .
Solución:
Tenemos que µ = 36.000, σ = 4.000 y n = 16.
Nos piden calcular P(X < 34.500).
Como no conocemos el tamaño de la población, supondremos que esta
es infinita. Entonces, por el teorema, la media y el error estándar de la
distribución muestral de X son:
µ𝑥 = µ = 36.000 y
𝜎𝑥 = σ / 𝑛=
4.000 / 16 = 1.000.
Entonces:
P(X < 34.500) = P[Z < (34.500−µ𝑥 ) /σ𝑋 = P[Z < (34.500−36.000) /1.000]
.
Por consiguiente, la probabilidad requerida es:
= P(−1,11 < Z < 1,67) = P(Z < 1,67) − P(Z < −1,11).
Teorema:
Si el muestreo se hace en una población normal con varianza desconocida y
si las muestras seleccionadas son de tamaño n < 30, entonces, la
distribución muestral de la media muestral X es la t de Student con n−1
grados de libertad.
(𝑥ҧ − µ)
Este teorema implica que la variable aleatoria t = 𝑠
𝑛
tiene distribución t – estudent con v= n − 1 grados de libertad.
La distribución t, de la misma manera que la distribución normal
estándar, tiene forma de campana y tiene media igual a 0, alrededor de la
cual es simétrica. Su varianza, en cambio, es mayor que 1, hecho que
origina que la típica distribución t sea menos aguda en el centro y “más
alta” en las colas que la distribución normal estándar.
Solución:
Tenemos que µ = 20, s = 4 y n = 16.
Debido a que la población es normal con σ desconocida y a que n < 30,
entonces, aplicaremos el teorema. Es decir,
la distribución muestral de la media muestral es la t de Student con v= n−1 =
15 grados de libertad.
Entonces: µ𝑥 = µ = 20 y σ𝑥 = s / 𝑛 =4/ 16 = 1.
Con esto, encontramos el valor de t para 21,753. Debido a que:
Ejemplo:
Una muestra aleatoria de seis autos de un determinado modelo
consumen las siguientes cantidades en kilómetros por litro:
18,6 18,4 19,2 20,8 19,4 20,5. Determine la probabilidad de que el
consumo de gasolina medio muestral de los automóviles de este
modelo sea menor que 17,6 kilómetros por litro, suponiendo que la
distribución de la población es normal con media 17.
Tenemos que µ = 17 y, en este caso, la muestra escogida es de tamaño
n = 6.
La media de la muestra es 𝑥ҧ =19.4833 y S = 0.98.
Debido a que la población es normal con varianza desconocida y a que n < 30,
entonces, por el teorema, la distribución muestral de la media muestral es la t de
Student con n−1 = 5 grados de libertad.,
Encontramos que:
µ𝑥 = µ = 17 y σ𝑥 =s / 𝑛 = 0,98 / 6 ≈ 0,4.
Con esto, el valor de t para 17,6 es t =(X −µ𝑥 )/ σ𝑥 = (17,6−17) / 0,4 = 1,5
Teorema:
Sea 𝑝Ƹ la proporción de éxitos en una muestra aleatoria de n observaciones.
Sea 𝑝0 la proporción de éxitos en la población. Entonces, la distribución
muestral de la proporción muestral 𝑝Ƹ tiene media µp = 𝑝0 y varianza σ2 dada:
por:
𝑝 (1−𝑝0 )
σ2𝑝 0 si la población es infinita,
𝑛
𝑁−𝑛 𝑝 (1−𝑝 )
σ2𝑝 = . 0 0
, si la población es finita, de tamaño N y si N no es
𝑁−1 𝑛
demasiado grande en comparación con n.
REPUBLICA DE COLOMBIA - UNIVERSIDAD DE LA COSTA - Especialización en
Estadística.
Teorema:
(Teorema de De Moivre-Laplace) Sea 𝒑ෝ la proporción de
éxitos en una muestra aleatoria de n observaciones. Si
se cumple alguna de las dos condiciones siguientes:
• n ≥ 30 o
• np ≥ 5 y n(1−p) ≥ 5,
Entonces, la distribución muestral de la proporción
muestral 𝒑 ෝ se puede aproximar con una distribución
normal.
ෝ − 𝒑𝟎
𝒑
z=
σ
Ejemplo:
Se toma una muestra de 250 casas de una población de edificios antiguos para
estimar la proporción de casas de este tipo cuya instalación eléctrica resulta
insegura. Supongamos que, de hecho, el 30% de todos los edificios de esta
población tienen una instalación insegura. Hallar la probabilidad de que la
proporción de edificios de la muestra con instalación insegura esté entre 0,25 y
0,35.
Solución:
Tenemos que p0= 0,30 y n = 250. Por consiguiente, tenemos que:
0,25 −p0 0.25−p0
P(0,25 < p < 0,35) = < 𝑧 <
σ σ
𝑝0 (1− 𝑝0 ) 0.30(1−0.30)
σ = = = 0.029
𝑛 250
P(0,25 < p < 0,35) = P(Z < 1,72) − P(Z < −1,72) = φ (1,72) − φ (−1,72) =
𝑝0(1− 𝑝0 ) 0.40(1−0.40)
σ = = = 0,1095
𝑛 20
Por consiguiente, la probabilidad pedida es:
0,5 −𝑃0 0,5 −0,4
P(p < 0,5) =P 𝑍 < = P 𝑍 < = P(Z< 0,91)
σ 0,1095
𝑝1 ( 1−𝑝1 ) 𝑝2 ( 1− 𝑝2 )
+ .
𝑛1 𝑛2
(𝑝ො1−𝑝ො2 ) −(𝑝1 − 𝑝2 )
Esto implica que: z = , tiene distribución normal
𝑝
𝑝1 (1− 𝑝2 ) (1− 𝑝2 )
2
𝑛1
+ 𝑛2
estándar. Además, esta aproximación es valida si se cumple alguna de las dos
condiciones siguientes:
• 𝑛1 ≥ 30 y 𝑛2 ≥ 30.
• • 𝑛1 𝑝1 ≥ 5, 𝑛1 (1−𝑝1 ) ≥ 5, 𝑛2 𝑝2 ≥ 5 y 𝑛2 (1−𝑝2 ) ≥ 5.
Ejemplo:
Los hombres y mujeres adultos radicados en una ciudad grande del norte
de cierto país difieren en sus opiniones sobre la promulgación de la pena
de muerte para personas culpables de asesinato. Se cree que el 12% de
los hombres adultos están a favor de la pena de muerte, mientras que
sólo el 10% de las mujeres adultas lo están. Si se pregunta a dos muestras
aleatorias, una de 150 hombres y otra de 100 mujeres, su opinión sobre
la promulgación de la pena de muerte para personas culpables de
asesinato, determine la probabilidad de que el porcentaje de hombres a
favor sea al menos 3% mayor que el de mujeres.
Representemos con:
𝑝1 el porcentaje de hombres a favor de la pena de muerte
𝑝2 el de mujeres.
𝑝1 −𝑝2 = 0,12−0,10 = 0,02
Fácilmente, podemos verificar que se cumplen las condiciones que se necesitan para
poder utilizar la aproximación del teorema. Por tanto, por este teorema, la
probabilidad pedida será:
P(𝑝1 −𝑝2 ≥ 0,03) = P(Z ≥ 0,25) = 1 − P(Z ≤ 0,25) = 1 − 0,5987 = 0,4013.
SOLUCIÓN:
(a) En la siguiente tabla se incluyen las diferencias di entre los datos de la tabla
anterior. Estas diferencias forman una muestra aleatoria procedente de una
población cuya media es µA−µB, la diferencia entre las medias poblacionales
entre dos modelos de autos.
Xi =(Auto A) 19,4 18,8 20,6 17,6 19,2 20,9 18,3 20,4
Yi =(Auto B) 19,6 17,5 18,4 17,5 18,0 20,0 18,8 19,2
di -0,2 1,3 2,2 0,1 1,2 0,9 -0,5 1,2
d = 0,775 v = n -1 = 7
𝑠𝑑2 = 0,816
𝑏. ) µ1 - µ2 = -0,807
𝑠𝑑
µ𝑑 = −0,27 σ𝑑 = = 0,3413
𝑛
0−(−0,807)
P(d1>d2) = P 𝑡 > =P(t>2,3645) = 0,025
0,3413
Muestras independientes
Consideremos dos poblaciones con medias µ1 , µ2 y varianzas 𝜎1 y 𝜎2,
respectivamente, y supongmos que se seleccionan dos muestra
aleatorias independientes de tamaños 𝑛1 , 𝑛2 , con medias 𝑋1 , 𝑋2 y
varianzas 𝑆1 y 𝑆2 , respectivamente. El objetivo también es
determinar la distribución muestral de 𝑋1 − 𝑋2 . Para ello
distinguiremos los siguientes casos:
Primer caso: varianzas poblacionales conocidas o desconocidas y
muestras grandes.
Si las dos poblaciones son normales, entonces, 𝑋1 −𝑋2 también es
normal. Por tanto, la variable aleatoria,
𝑋 −𝑋 − µ1 − µ2
Z = 1 2 ,tiene una distribuci´on normal estándar.
𝜎2
1 𝜎2
2
+
𝑛1 𝑛2
Teorema:
Sean 𝑥1 , y 𝑥2 , las medias de muestras aleatorias
independientes de tamaños 𝑛1 y 𝑛2 de poblaciones con
medias µ1 , µ2 y varianzas 𝜎12 y 𝜎22 respectivamente.
Supongamos que se cumple alguna de las siguientes
condiciones:
(a) Ambas poblaciones son normales y ambas varianzas
poblaciones 𝜎12, 𝜎22 son conocidas;
(b) Ambas poblaciones son desconocidas o no normales,
ambas varianzas poblacionales 𝜎12 y 𝜎22 son conocidas o
desconocidas y 𝑛1 ≥ 30, 𝑛2 ≥ 30.
Ejemplo:
En un estudio para comparar los pesos promedios de niños y niñas de
sexto grado en una escuela de instrucción media, se usará una muestra
aleatoria de 20 niños y otra igual de 25 niñas. Se sabe que, tanto para
niños y niñas, los pesos siguen una distribución normal. El promedio de
los pesos de todos lo niños de sexto grado de esa escuela es de 100
libras y su desviación estándar es de 14,142, mientras que el promedio
de los pesos de todas las niñas del sexto grado es de 85 libras y su
desviación estándar es de 12,247. Encuentre la probabilidad de que el
promedio de los pesos de los 20 niños sea al menos 20 libras más
grande que el de los de las 25 niñas.
Supongamos que 𝑋1 representa el promedio de los pesos de 20 niños y
𝑋2 , el promedio de los pesos de una muestra de 25 niñas. Nos piden
calcular P( 𝑋1 − 𝑋2 > 20). Como las dos poblaciones en cuestión son
normales y con varianzas conocidas, entonces, por el teorema, tenemos.
Entonces, para determinar P(𝑋1 −𝑋2 > 20), encontramos el valor Z para una
diferencia de 20 libras.
20 −15
𝑍 < = 1,25,
16
P(𝑋1 −𝑋2 > 20) = P(Z ≥ 1,25) = 1 − P(Z ≤ 1,25) = 1 − 0,8944 = 0,1056.
σ2 σ2
+ , Además, se puede probar que si las dos poblaciones son
𝑛1 𝑛2
normales, entonces, 𝑋1 −𝑋2 también es normal. Por tanto, la variable
aleatoria-
𝑋1 −𝑋2 − µ1 − µ2
t = , 𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙
𝑠2 𝑠2
+
𝑛1 𝑛2
𝑛1 −1 𝑠12 + 𝑛2 −1 𝑠22
𝑆 2
= 𝑛1 − 𝑛2 −2
; varianza muestral combinada.
Teorema:
Si 𝜎12 = 𝜎22. son iguales y desconocidas, entonces, la distribución
muestral de la media tiene media µ1 − µ2 y varianza estimada igual a
𝑠2 𝑠2
+ , siendo 𝑠 2 es la varianza muestral combinada. Además, si las
𝑛1 𝑛2
dos poblaciones en cuestión son normales y los tamaños de las
muestras son pequeños (es suficiente considerar que sean
estrictamente menores que 30), entonces, la variable aleatoria
𝑋1 −𝑋2 − µ1 − µ2
t = esta distribuida se según la distribución t con
𝑠2 𝑠2
𝑛1
+ 𝑛2
v=𝑛1 − 𝑛2 − 2 grados de libertad.
Ejemplo:
Suponga que dos drogas A y B, de las que se dice que reducen el tiempo de
respuesta de las ratas a determinado estimulo, se están comparando en un
experimento de laboratorio. El experimentador supone que las respectivas
poblaciones de los tiempos de respuesta al estimulo no están distribuidos
normalmente y tienen varianzas iguales. Se administra la droga A a 12 ratas
y la droga B a 13. Cuando se lleva a cabo el experimento, la reducción
promedio de tiempo de respuesta al estimulo por parte de las ratas que
están recibiendo la droga A es 30,45 milisegundos con una desviación típica
de 5 milisegundos.
Los datos correspondientes a la droga B son 24,9 y 6 milisegundos. ¿Cual es
la probabilidad de que la diferencia entre la reducción promedio de tiempo
de respuesta al estimulo por parte de las ratas que están recibiendo la droga
A y la reducción promedio de tiempo de respuesta al estimulo por parte de
las ratas que están recibiendo la droga B sea menor o igual a la que se
observo´ en el experimento? Suponga que no hay diferencia alguna entre las
dos drogas con respecto a la reducción promedio en tiempos de respuestas y
que las drogas son igualmente efectivas.
Debido a que no hay diferencia alguna entre las dos drogas con respecto a
la reducción promedio en tiempos de respuestas y que las drogas son
igualmente efectivas, entonces, . Por µ𝐴 − µ𝐵 consiguiente, la media de
la distribución muestral de 𝑋𝐴 −𝑋𝐵 = 0.
2 𝑛𝐴 −1 52 + 𝑛𝐵 −1 62
𝑆 = = 30,74
12 −13−2
𝑠2 𝑠2 30,74 30,74
+ = + = 4,92
𝑛𝐴 𝑛𝐵 12 13
Con base en los datos, el valor t está dado por:
𝑋1 −𝑋2 − µ1 − µ2 5,55− 0
t = = = 2,25
𝑠2 𝑠2 2,22
+
𝑛1 𝑛2
𝑠2 𝑠 2 2
1+ 2
𝑛1 𝑛2
V= 2 2 grados de libertad.
𝑠2
1 𝑠2
2
𝑛1 𝑛2
+
𝑛1 −1 𝑛2 −1
Ejemplo:
Repita el ejemplo anterior, pero ahora suponiendo que las poblaciones
no tienen distribución normal, que los tamaños muestrales son menores
que 30 (digamos 𝑛𝐴 = 12 y 𝑛𝐵 = 13) y que las varianzas poblacionales son
diferentes.
𝑠2 𝑠 2 2 2
1+ 2 52 62
𝑛1 𝑛2 +
12 13
V = 2 2 = 2 2 = 22,78 se aproxima 23
𝑠2
1 𝑠2
2 52 62
𝑛1 𝑛2 12 13
+ 𝑛 −1 +
11 12
𝑛1 −1 2