Diapositiva de Estimacion

TEORIA DE ESTIMACION
ESTADISTICA INFERENCIAL
MGc. KENNEDY HURTADO IBARRA
BARRANQUILLA- COLOMBIA
Referencias:
Llínas, Humberto: Estadística Inferencial.
Canavos, George, Probabilidad y Estadísticas Aplicaciones y Métodos.
Montgomery, Douglas: Probabilidad y estadística para ingeniería.
Teoría de Estimación
Objetivos del capitulo.
1. Desarrollar los conceptos de estimación estadística, estimador,
estimación puntual y de intervalos.
2. Desarrollar estimaciones de intervalos de confianza para la

media, proporción, diferencia de dos medias, diferencia de dos
proporciones, varianza y razón de dos varianzas.
3. Determinar el tamaño de la muestra necesario para obtener un

intervalo de confianza deseado.
Definición: La inferencia estadística.
Se define como el procedimiento mediante el cual se pueden sacar
conclusiones acerca de una población partiendo de la información
contenida en una muestra que se ha sacado de esa población.
Definición: Estimación estadística

Es el proceso mediante el cual intentamos determinar el valor de un parámetro
de la población, sin hacer un censo, a partir de la información de una muestra.
Una estimación es el valor numérico que creemos que tiene el parámetro, y el
estimador es el estadístico de la muestra, utilizado para hacer una estimación.
Para estudiar la estimación de un parámetro desconocido, debemos considerar

dos tipos de estimaciones: estimación puntual y estimación por intervalos.
:
Estimación puntual
7.1.1 Introducción
Se presentan muchas situaciones en las que alguna persona (el que
toma una decisión, un planificador de programa o un investigador)
desea conocer los valores de parámetros poblacionales tales como
la media, la proporción, la diferencia de medias, la diferencia de
proporciones, la varianza y la razón de dos varianzas como las que se
muestran a continuación:
• Un criminalista desea conocer qué proporción de personas
convictas de un crimen sufren de alguna desviación mental.
• Un funcionario de salud publica podría estar interesado en conocer
la edad promedio en que empezó a adquirir el hábito de fumar
alguna población de fumadores.
Definición: Estimador Puntual.
El estimador puntual de un parámetro poblacional es una función de la muestra
que da como resultado un único valor. Un valor en particular de un estimador
puntual se llama una estimación puntual del parámetro.
Ejemplo:
Considere las 20 observaciones adjunta de voltaje de ruptura dieléctrica de
piezas de resina epóxica.
24,46 25,61 26,25 26,42 26.66 27.15 27,31 27,54 27,74 27,94
27,98 28,04 28,28 28,49 28,50 28,87 29,11 29,13 29,50 30,88
Se supone que la distribución de voltaje de ruptura es normal con valor medio
µ. Como la distribuciones normales son simétrica, µ también es la vida útil
mediana de la distribución. Se supone entonces que las observaciones dadas
son el resultado de una muestra aleatoria 𝑥1 , 𝑥2 ………….. 𝑥20 de esta
distribución normal. Considere los siguientes estimadores y las estimaciones
resultantes de µ.
Teoría de Estimación𝑥 555,86
a. Estimador = 𝑋ത = estimación = 𝑥ҧ =σ 𝑖 = = 27,793
𝑛 20
b. Estimador = med, estimación med = (27,94-27,98)/ 2 = 27,96

c. Estimador = 𝑠 2 , estimación 𝑠 2 = 2,137
¿Qué propiedades de la distribución muestral de un estimador θ෠ 𝒊 son
deseables para estimar el parámetro de la población θ?.
Para responder esta pregunta presentamos tres criterios para escoger un “buen”
estimador. Insesgo, eficiencia y consistencia.
EJERCICO:
Considere la siguiente muestra de observaciones de módulo elástico (GPa) de
especímenes de aleación AZ91D tomados de un proceso de fundición a troquel:
44.2; 43.9; 44.7; 44.2; 44.0; 43.8; 44.6 y 43.1. Suponga que estas
observaciones son el resultado de una muestra aleatoria 𝑋1 , . . . , 𝑋2 ; tomada de
la distribución de población de módulos elásticos en semejantes circunstancias.
Se desea estimar la varianza de la población σ2 . Un estimador natural es la
varianza muestral:
2
σ 𝑋𝑖
σ 𝑋𝑖 −𝑋ത 2 σ 𝑋𝐼2 −
ෝ2
σ = 𝑆2 = = 𝑛
, la estimación correspondiente es:
𝑛−1 𝑛−1
2
σ 𝑥𝑖 352.5 2
σ 𝑥𝐼2 − 1 5533.79−
𝑛 8
= = 0.21525
𝑛−1 7
Entonces : s = 0.21525 = 0.251
Proposición:
Cuando X es una variable aleatoria binomial con parámetros n y p, la proporción
𝑋
muestral 𝑝Ƹ = es un estimador insesgado de p.
𝑛
𝑋 1 1
E(𝑝)Ƹ = E = E(x) = np =p
𝑛 𝑛 𝑛
No importa cuál sea el valor verdadero de p, la distribución del estimador 𝑝Ƹ

estará centrada en el valor verdadero.
Pautas para escoger un estimador:
Consideremos algún parámetro θ de la población y un conjunto de estadísticos
θ1 ,θ2 ………..θ𝑛 , que puede ser consideradas como estimadores de θ. Dejamos
que θ sea cualquier medida particular de una población porque los criterios que
comentaremos deben aplicarse a cualquier estimador. Por ejemplo:.
Insesgo:
Definición: Se dice que un estimador 𝜃෠ es insesgado, si el valor esperado del
estimador es igual al parámetro de la población que está estimando, es decir,
෠ =θ, evidentemente si E(𝜃)
E(𝜃) ෠ ≠θ, se dice que es sesgado.
Llamaremos sesgo la diferencia entre la media del estimador 𝜃෠ y el parámetro θ,
es decir,
෠ - θ.
Sesgo de (θ) = E(𝜃)
Poposicion:
Sean 𝑋1 , 𝑋2 , . . . , 𝑋𝑛 una muestra aleatoria de una distribución con media µ y varianza σ2 .
σ 𝑋𝑖 −𝑋ത 2
Entonces el estimador: σ2
ෝ = 𝑆2 = σ2 .
, es un estimador insesgado de ෝ
𝑛−1
Dms. Para cualquier variable aleatoria Y, V(Y) = E 𝑌 2 - [ E 𝑌 ]2 , por lo tanto;

E 𝑌 2 = V(Y) +[ E 𝑌 ]2 , aplicando esto, se tiene:
1 σ 𝑋𝑖 2 1 1
2
𝑆 = σ 𝑋𝑖2 − = E(𝑆 ) 2
= σ 𝐸(𝑋𝑖2 ) − [𝐸 σ 𝑋𝑖 2 ]
𝑛−1 𝑛 𝑛−1 𝑛
1 1
σ σ2 + µ2 − {𝑉(σ 𝑋𝑖 ) + 𝐸 σ 𝑋𝑖 2} =
𝑛−1 𝑛
1 1 1
σ 𝑛σ2 + 𝑛µ2 − 𝑛σ2 − 𝑛µ 2 =
𝑛−1 𝑛 𝑛
1
[𝑛σ2 - σ2 ] = σ2 , como se desea.
𝑛−1
EJERCICIOS:
1. Supóngase que X es una variable aleatoria con media µ y varianza σ2, Sea
X1, X2,…….Xn una muestra de tamaño n tomada de una población representada por
X. Demuestre que la media muestral X y la varianza muestral S2 son estimadores
insesgados de µ y σ2., respectivamente.
2. Sea X1,X2…Xn, una muestra aleatoria de algunas distribuciones tal que E(Xi) = µ y
var(Xi) = σ2 i= 1,2……..n. Considere las estadísticas:
θ1 = X y θ2 = ∑ Xi /(n + 1) como posibles estimadores de µ. Obtener los
errores cuadráticos medios de θ1 y θ2 y demostrar que ECM(θ2) < ECM(θ1) para
algunos valores de µ mientras que la proposición inversa es cierta para otros
valores de µ.
Eficiencia.
Suponga que se puede usar una muestra aleatoria simple de n elementos para
obtener diferentes estimadores puntuales insesgados del mismo parámetro
poblacional. En este caso, preferimos usar el estimador puntual con la menor
desviación estándar por que tiende a proporcionar estimadores mas cercanos al
parámetro poblacional. Se dice que el estimador puntual con la menor
desviación estándar tiene una mayor eficiencia relativa que el otro.
Definición:
Sean 𝜃෠1 y 𝜃෠2 dos estimadores insesgados de θ, obtenidos en muestras del
mismo tamaño. Entonces:
a. Se dice que θ෠ 1 , es mas eficiente que θ෠ 2 , si la varianza de la distribución
muestral de θ෠ 1 , es menor que la varianza de la distribución muestral θ෠ 2 , es
decir, ). V (θ෠ 1 ) < V(θ෠ 2 )
V ( ෡2 )
θ
b. La eficiencia relativa de θ෠ 2 con respecto a θ෠ 1 , es el cociente ෡ de sus
V(θ1 )
varianzas.
Definición:
Si θ෠ es un estimador insesgado de θ y no hay ningún otro estimador insesgado
que tenga menor varianza, entonces se dice que θ෠ es el estimador insesgado
mas eficiente o de mínima varianza de θ.
Ejemplo:
Algunos ejemplos de estimador insesgado de mínima varianza son:
1. La media muestral cuando la muestra proviene de una distribución normal
2. La varianza muestral cuando la muestra proviene de una distribución normal.
1. La proporción muestral binomial.

Consistencia.
Una ultima propiedad asociada con los buenos estimadores puntuales es la
consistencia, propiedad que se puede definir en términos generales como se
indica a continuación.
Definición:
Un estimador puntual θ෠ de θ es consistente para θ si sus valores tienden a
acercarse al parámetro poblacional θ conforme se incrementa el tamaño de la
muestra . De otro modo, el estimador se llama inconsistente.
Definición: El error cuadrático de un estimador puntual θ෠ al parámetro θ es la
esperanza del cuadrado de la diferencia de media entre el estimador y el
parámetro, es decir, ECM(θ)෠ = E[(θ෠ − θ)2 ]
Estimación de máxima verosimilitud
El método de máxima probabilidad lo indujo por primera vez R. A Fischer,
genetista y estadístico en la década de 1920. La mayoría de los estadísticos
recomiendan este método, por lo menos cuando el tamaño de la muestra es
grande, puesto que los estimadores resultantes tienen ciertas propiedades de
eficiencias deseables.
Ejemplo:
Sean 𝑥1 , 𝑥2 , … … … . . 𝑥𝑛 una muestra aleatoria de una distribución
2
normal. La
(𝑥 − µ)
1 ( )
función de probabilidad es f(𝑥1 , 𝑥2 , … … … . . 𝑥𝑛 ; µ; σ2 )= .𝑒 σ =
2ᴫσ
𝑛 (𝑥 − µ)2
1 ( σ )
( ) 2 𝑒
2ᴫσ2
𝑛 1
Por consiguiente ln[f(𝑥1 , 𝑥2 , … … … . . 𝑥𝑛 ; µ; σ2 ] = - ln(2ᴫσ2 ) - σ(𝑥𝑖 − µ)2
2 2σ2
Para determinar los valores maximizantes de µ y σ2 se debe tomar las
derivadas parciales de ln(f) con respecto a µ y σ2 igualarlas a cero y resolver las
dos ecuaciones resultantes. Entonces los estimadores de máxima probabilidad
resultantes son:
µ = 𝑋ത
σ(𝑥𝑖 −µ)2
σ2 = ,.
𝑛
El estimador de máxima verosimilitud de σ2 no es el estimador insesgado.
Intervalo de confianza
Existe un problema obvio relacionado con el uso de las estimaciones puntuales.
Aunque sólo está implícito un parámetro, el número disponible de estimaciones
es generalmente muy grande. Cada una de las muestras posibles que se
pueden sacar de la población que interesa arroja una estimación. Para el
estudio de las distribuciones muestrales realizadas anteriormente, sabemos que
algunas estimaciones estarán más cerca del parámetro que se está calculando
que otras. Sin embargo, no sabemos qué tan cerca está nuestra única
estimación puntual del parámetro verdadero. En una situación determinada
podemos considerar sumamente improbable que la estimación puntual sea
exactamente igual al parámetro, pero no estamos en condiciones de decir en
cuanto nos hemos equivocado.
Ejemplo:
Supongamos que un control realizado sobre una muestra aleatoria de piezas

procedentes de un gran envío nos lleva a estimar que el 10% de todas las
piezas son defectuosas. Un gerente que se enfrenta a este dato posiblemente
se hará preguntas del tipo:
• ¿Puedo estar totalmente seguro de que el verdadero porcentaje de piezas
defectuosas está entre el 5% y el 15%?
• ¿Se puede afirmar que el verdadero porcentaje de piezas defectuosas mayor
que el 8%?
• ¿Es muy posible que entre el 9% y el 11% de las piezas sean defectuosas?
Dentición: Estimación por Intervalos
Un estimador por intervalos de un parámetro poblacional es un estadístico para

determinar un rango, o un intervalo, en el cual posiblemente se encuentre dicho
parámetro. La estimación correspondiente se denomina estimación por
intervalos.
Teorema:
Si se extraen repetidamente muestras de la población y se calculan los

intervalos de esta manera, entonces, el (1−α)100% de los intervalos contendrán
el parámetro desconocido.
. Intervalos de confianza para la media poblacional.
En la sección anterior mostramos que el valor de la media muestral x da como

resultado estimados puntuales de la media poblacional µ. Como los estimados
puntuales se basan en una muestra de la población, no se espera que sean
iguales al parámetro poblacional correspondiente. En esta sección mostraremos
cómo se elaboran estimados de intervalo de la media, para proporcionar
información sobre la precisión de un estimado. Para ello, dividiremos el estudio
teniendo en cuenta dos casos: el caso de tener muestras grandes y el de tener
muestras pequeñas.
. El caso para muestras grandes
Imaginemos que se extrae una muestra aleatoria de una distribución con media
desconocida. Nuestro objetivo es hallar un intervalo de confianza para la media
poblacional suponiendo que se cumple alguna de las siguientes tres
condiciones:
• La población es normal con varianza conocida.
• La población es normal con varianza desconocida y el tamaño de la muestra
es grande.
• La forma de la población es desconocida (o no normal), su varianza es
conocida o desconocida y el tamaño de la muestra es grande.
.
Teorema:.
Sea 𝑥ҧ la media de una muestra aleatoria de tamaño n tomada de una población
con media µ y varianza σ2 > 0. Supongamos que se cumple algunas de las
siguientes condiciones :
1. La población es normal y σ2 es conocida ( no importa el tamaño de n).
2. La población es normal, σ2 es desconocida y n ≥ 30.
3. La forma de la población es desconocida (o no normal), σ2 es conocida o
desconocida y n ≥ 30.
Entonces el intervalo de confianza de (1- α ) 100% para µ es:
σ σ ҧ µ
𝑥−
[𝑥ഥ - 𝑧α < µ <𝑥ഥ + 𝑧α ], siendo 𝑧α el valor de z= σ a la derecha
2 𝑛 2 𝑛 2 𝑛
α
del cual se tiene un área de en la distribución normal.
2
.
Si la población es finita de tamaño N y el muestreo se hace sin remplazo, se
σ σ N−n
remplaza por
n n n−1
Ejemplo:
Un fabricante produce bolsas de arroz. El peso del contenido de estas bolsas

tiene una distribución normal con desviación típica 15 gramos. Los contenidos
de una muestra aleatoria de 25 bolsas tienen un peso medio de 100 gramos.
Calcular un intervalo de confianza del 95% para el verdadero peso medio de
todas las bolsas de arroz producidas por el fabricante.
Solución:
Como buscamos un intervalo de confianza del 95%, tenemos 1- α = 95%, por lo
que α = 5% = 0,05. Obsérvese que se cumplen las condiciones que aparecen
en la parte 1) del teorema. Por consiguiente, por ese mismo teorema, el
intervalo de confianza del 95 % para la media poblacional µ es:
σ σ
[𝑥ഥ - 𝑧α < µ <𝑥ഥ + 𝑧α ].
2 𝑛 2 𝑛
De la tabla normal, encontramos que 𝑧α = 𝑧0,05 = 1,96, porque P(z 1,96) = 0,025.
2
Debido a que 𝑥ҧ = 100; σ = 15 y n = 25
15
15
[ 100 -1,96 < µ < 100 +1,96 ]
25 25
[94,1 < µ < 105,88]

Por lo tanto podemos concluir que, con una confianza del 95%, el verdadero
peso medio de todas las bolsas de arroz producidas por el fabricante se
encuentra entre 94,12 y 105,88 gramos.
Ejercicio:
Un biólogo desea hacer una estimación con un intervalo de confianza del 95%
de la cantidad promedio de agua que consume cierta especie animal en
condiciones experimentales. De alguna manera, el investigador logra determinar
que la población de valores de consumo diario de agua está distribuida
normalmente. Una muestra aleatoria de 36 animales arroja una media de 16,5
gramos con una desviación estándar de 2 gramos.
Ejercicios:
Resuelva nuevamente el ejemplo anterior pero utilizando un grado de confianza
del 90 y 99%. Compare los resultados encontrados en ambos ejemplos.
El caso para muestras pequeñas
El siguiente teorema nos sugiere utilizar la distribución t de Student para derivar

intervalos de confianza para la media de una población normal cuando la
varianza poblacional es desconocida (o no normal) y el tamaño de la muestra es
pequeña (n < 30).
Teorema:
Sean 𝑥ഥ y 𝑠 2 la media y varianza de una muestra aleatoria de tamaño n < 30
tomada de una población normal con media µ y varianza σ2 desconocida.
Entonces, el intervalo de confianza de (1 − α)100% para µ es:
𝑠 𝑠
[𝑥ഥ - 𝑡α < µ <𝑥ഥ + 𝑡α ].
2 𝑛 2 𝑛
.
ҧ µ
𝑥− σ
siendo 𝑡α el valor de t = 𝑠 a la derecha del cual se tiene un área de en la
2 2
𝑛
distribución t de Student con n − 1 grados de libertad.
𝑠 𝑠 𝑁−𝑛
Si la población es finita de tamaño N, se reemplaza por . Es importar
𝑛 𝑛 𝑁−1
enfatizar que cuando la forma de la distribución de la población es desconocida
o es no normal, entonces, no hay ningún método general para establecer una
estimación de intervalo de la media poblacional µ.
.
EJEMPLO:
Los contenidos de 7 recipientes similares de acido sulfúrico son 9,8; 10,2;
10,4; 9,8; 10,0; 10,2 y 9,6 litros. Encuentre un intervalo de confianza del 95%
para la media de todos los recipientes, suponiendo que la población de valores
tiene distribución normal.
SOLUCION:
Tenemos que n = 7. Además, la media y desviación de los datos dados son:
𝑥ҧ = 10,0 y s = 0,283 litros, respectivamente.
Fácilmente, podemos verificar que las hipótesis del teorema se cumplen.
Debido a que 𝑡α = 𝑡0´025 = 2,447, el intervalo buscado será:

2
𝑠 𝑠
[𝑥ഥ - 𝑡α < µ <𝑥ഥ + 𝑡α ].
2 𝑛 2 𝑛
0,283 0,283
[10,0- 2,447 < µ <10,0 + 2,447 ]
7 7
[ 9,74 < µ < 10,26 ]

Es decir, con una confianza del 95%, podemos afirmar que la media de todos
los recipientes se encuentra entre 9,74 y 10,26 litros.
Ejercicio:
Una muestra aleatoria de seis autos colombianos de un determinado modelo
consumen las siguientes cantidades en kilómetros por litro: 18,6; 18,4; 19,2;
20,8; 19,4 y 20,5. Calcule un intervalo de confianza del 90% para el consumo de
gasolina medio poblacional de los autos de este modelo, suponiendo que la
distribución de la población en cuestión es normal.
Intervalos de confianza para la proporción
Supongamos que estamos interesados ahora en la proporción de

miembros de la población que poseen un determinado atributo. Por
ejemplo, podríamos querer estimar la proporción de individuos mayores
de edad que van a votar por cierto candidato presidencial. Si se toma una
muestra aleatoria, un estimador puntual razonable de la proporción
poblacional es la proporción muestral. El siguiente teorema muestra como
construir intervalos de confianza para la proporción poblacional
.
Teorema:
Sea 𝑝Ƹ la proporción de éxitos en una muestra aleatoria de tamaño n, procedente
de una población con proporción p éxito. Supongamos que se cumple alguna de
la dos siguientes condiciones:
1. n ≥ 30.
2. np ≥ 5 y n(1-p) ≥ 5
Entonces un intervalo de confianza aproximado de ( 1- α) 100% para p es:
ො
𝑝(1− ො
𝑝) ො
𝑝(1− ො
𝑝) 𝑝ෝ −𝑝
2. [𝑝Ƹ - 𝑧 α < p < 𝑝Ƹ + 𝑧 α ] , donde 𝑧 es el valor de z =
α ,
2 𝑛 2 𝑛 2 ෝ (1−𝑝
𝑝 ෝ)
𝑛
α
con un a la derecha de la distribución normal.
2
.
Algunas observaciones al respecto son las siguientes :
1. Cuando n es pequeña y se cree que la proporción desconocida p se acerca
a cero o a uno, el procedimiento establecido aquí para el intervalo de
confianza no es confiable y, por lo tanto, no debe ser utilizado.
2. Para el caso de una población finita de tamaño N, debemos reemplazar
ො
𝑝(1− ො
𝑝) ො
𝑝(1− ො
𝑝) 𝑁 −𝑛
por la cantidad . .
𝑛 𝑛 𝑁−1
Ejemplo:
En una muestra aleatoria de 85 soportes para la pieza de un motor de
automóvil, 10 tienen un pequeño defecto. Calcular un intervalo de confianza del
95% para la proporción p de piezas de motor en la población que tiene un
pequeño defecto.
Debido a que n =85, entonces, una estimación puntual de la proporción de
10
piezas de motor en la población que tiene un pequeño defecto es 𝑝Ƹ = = 0,12.
85
Debido a que las hipótesis del teorema se cumplen y ha que 𝑧α = 𝑧0,025 = 1,96,
2
entonces un intervalo de confianza para p es:
ො
𝑝(1− ො
𝑝) ො
𝑝(1− ො
𝑝)
[𝑝Ƹ - 𝑧α < p < 𝑝Ƹ + 𝑧α ], entonces :
2 𝑛 2 𝑛
0,12 (0,88) 0,12 (0,88)

[0,12- 1,96 < p < 0,12+ 1,96 ]
85 85
[0,05 < p < 0,19]

Ejercicio:
Las empresas de búsqueda de ejecutivos se especializan en ayudar a las empresas a ubicar y

asegurar talento para la alta gerencia. Tales firmas son responsables de la ubicación de muchos
de los mejores directores ejecutivos de la nación. Una reconocida revista reporto´ que “uno de
cada cuatro directores ejecutivos es una persona con más de 35 anos de edad”. Si en una
muestra aleatoria de 350 compañías de cierto país, 77 tienen directores ejecutivos con más de
35 años de edad, ¿un intervalo de confianza del 99% apoyaría la afirmación?
Intervalos de confianza para la diferencia de dos proporciones.
En la sección anterior construimos intervalos de confianza para una única
proporción poblacional. En muchas ocasiones, estamos interesados en
comparar dos proporciones. Por ejemplo, podríamos querer comparar la
proporción de jugadores de futbol que siguen activos a los 35 años con la de
atletas que tienen ese atributo. El siguiente teorema muestra cómo construir
intervalos de confianza para la diferencia entre dos proporciones poblacionales
cuando se toman dos muestras aleatorias independientes procedentes de
ambas poblaciones.
Teorema:
Sea 𝑝Ƹ1 la proporción de éxitos observada en una muestra aleatoria de tamaño
𝑛1 , procedente de una población con proporción 𝑝1 de éxitos, y sea 𝑝Ƹ 2 la
proporción de éxitos observada en una muestra aleatoria independiente de
tamaño 𝑛2 , procedente de una población con proporción de éxitos 𝑝2 .
Supongamos que se cumple alguna de las siguientes dos condiciones:
a) 𝑛1 ≥ 30 y 𝑛2 ≥ 30;
(b) 𝑛1 𝑝1 ≥ 5 ; 𝑛1 (1 −𝑝1 ) ≥ 5,
𝑛2 𝑝2 ≥ 5 y 𝑛2 (1 −𝑝2 ) ≥ 5. Entonces, un intervalo de confianza aproximado de
(1 − α)100% para 𝑝1 − 𝑝2 es:
Entonces, un intervalo de confianza aproximado de (1 − α)100% para 𝑝1 − 𝑝2
es:
𝑝ො1 1−𝑝ො1 𝑝ො2 (1−𝑝ො2 ) 𝑝ො1 1−𝑝ො1 𝑝ො2 (1−𝑝ො2 )
[(𝑝Ƹ1 -𝑝Ƹ 2 )- 𝑧α + < 𝑝1 − 𝑝2 < (𝑝Ƹ1 -𝑝Ƹ 2 ) + 𝑧α + ]
2 𝑛1 𝑛2 2 𝑛1 𝑛2
Donde :
𝑝ො1 −𝑝ො2 −(𝑝1 −𝑝2 ) α
𝑧 α es el valor de z = con un área de a la derecha de la
ෝ 1 1−𝑝
𝑝 ෝ1 ෝ (1−𝑝
𝑝 ෝ 2) 2
2 + 2
𝑛1 𝑛2
distribución normal.
Ejemplo:
Se extrajeron dos muestras aleatorias independientes de estudiantes
universitarios de estadística de sexo masculino y femenino. De 120 hombres,
107 esperaban disfrutar de un trabajo de tiempo completo en un máximo de 6
años. De 141 mujeres encuestadas, 73 tenían esta esperanza. Hallar un
intervalo de confianza del 95% para la diferencia entre las proporciones
poblacionales
Solución:
107 73
𝑛1 = 120; 𝑝Ƹ1 = =0,892 𝑛2 = 141; 𝑝Ƹ 2 = =0,518
120 141
Debido a que las condiciones del teorema se cumplen y 𝑧α =𝑧0.025 = 1,96.
2
0,892 0,108 0,518 (0,482) 0,892 0,108 0,518 (0,482)
[(0,892-0,518)-1,96 + < 𝑝1 − 𝑝2 <(0,892-0,518) + 1,96 + ]
120 141 120 141
= [ 0,275 < 𝑝1 − 𝑝2 < 0,473]
El hecho de que el cero no se encuentra en este intervalo, podemos afirmar con una confianza
del 95% que la proporción de hombres que esperan trabajar como tiempo completo en un
máximo de 6 años es mayor que la de las mujeres.
Ejercicio:
En una muestra aleatoria de 85 soportes para la pieza de un motor de automóvil, 10 tienen un
pequeño defecto. Supóngase que se hace una medicación al proceso de acabado de la
superficie y que, de manera subsecuente, se toma una segunda muestra aleatoria de 85 ejes. Si
el numero de soportes defectuosos en esta segunda muestra es 8, calcule un intervalo de
confianza del 95% para la diferencia en la proporción de los soportes defectuosos producidos
por ambos procesos.
Intervalos de confianza para la diferencia de dos medias
En muchas situaciones practicas es de gran interés obtener un intervalo de confianza para la
diferencia entre dos medias poblacionales. En esta estudiamos las distribuciones muestrales
apropiadas para la construcción de intervalos de confianza para la diferencia entre medias de
población en una diversidad de situaciones. En esta sección vamos a estudiar separadamente
dichas situaciones.
Primer caso: varianzas poblacionales conocidas o desconocidas y muestras grandes
Teorema: Sean 𝑥ҧ1 y 𝑥ҧ2 las medias de muestras aleatorias independientes de tamaños 𝑛1 𝑦 𝑛2 de
poblaciones con medias µ1 , y µ2 varianzas σ12 , σ22 , respectivamente. Supongamos que se
cumple alguna de las siguientes condiciones:
(a) Ambas poblaciones son normales y ambas varianzas poblaciones son conocidas;
(b) Ambas poblaciones son desconocidas o no normales, ambas varianzas poblacionales σ12 , σ22
son conocidas o desconocidas y 𝑛1 ≥ 30, 𝑛2 ≥ 30. Entonces, un intervalo de confianza de (1 −
α)100% para µ1 − µ2 es:
σ21 σ22 σ21 σ22
[(𝑥ҧ1 -𝑥ҧ2 )- 𝑧α + <µ1 − µ2 < (𝑥ҧ1 -𝑥ҧ2 ) + 𝑧α + ]
2 𝑛1 𝑛2 2 𝑛1 𝑛2
Donde, 𝑧α es el valor de:

2
𝑥ҧ 1 −𝑥ҧ 2 −(µ1 −µ2 )
z= ,
σ2
1 σ2
𝑛1
+𝑛 2
2
α
que deja un área de a la derecha de la distribución normal. En el caso en que las varianzas
2
poblacionales son desconocidas, utilizamos las desviaciones muestrales repectivas como
estimación de las correspondientes desviaciones poblacionales.
Ejemplo:
Para una muestra aleatoria de 321 fumadores, el número medio de horas de absentismo laboral
al mes fue de 3,01 y la desviación típica muestral fue de 1,09 horas al mes. Para una muestra
aleatoria independiente de 94 trabajadores que nunca han fumado, el número medio de horas
fue de 2,88 y la desviación típica muestral fue de 1,01 horas al mes. Calcular un intervalo de
confianza del 95% para la diferencia entre las dos medias poblacionales.
SOLUCION: Dado que los tamaños muestrales son grandes, podemos utilizar las varianzas
muestrales en lugar de las varianzas poblacionales desconocidas de la siguiente manera:
𝑠12 𝑠22 𝑠12 𝑠22
[(𝑥ҧ1 -𝑥ҧ2 )- 𝑧α + <µ1 − µ2 < (𝑥ҧ1 -𝑥ҧ2 ) + 𝑧α + ]
2 𝑛1 𝑛2 2 𝑛1 𝑛2
siendo
𝑛1 = 321, 𝑥ҧ1 =3,01, 𝑠1 = 1,09;
𝑛2 = 94, 𝑥ҧ2 =2,88, 𝑠2 = 1,01
y para un intervalo de confianza del 95%, se tiene que 𝑧α = 𝑧0,025 = 1,96. Por consiguiente, el
2
intervalo es:
(1,09)2 (1,01)2 (1,09)2 (1,01)2

[(3,01-2,88)- 1,96 + <µ1 − µ2 < (3,01-2,88) + 1,96 + ]
321 94 321 94
o bien
[−0,11 < µ1 − µ2 < 0,37].
Dado que el cero está dentro del intervalo de confianza, no hay suficiente evidencia en los datos
como para rechazar la idea de que ambas poblaciones tienen la misma media.
Ejercicio propuesto:
Se llevan a cabo pruebas de resistencia a la tensión sobre dos diferentes clases de tubos de
aluminios utilizados en la fabricación de alas de aeroplanos comerciales. De la experiencia
pasada con el proceso de fabricación de tubos y del procedimiento de prueba, se supone que
las desviaciones estándar de las resistencias a la tensión son conocidas. Los datos obtenidos
son como se muestran a continuación:
Clases de tubos Tamaño de la Media de la Desviación
muestra resistencia a la estándar(kg/mm2)
(kg/mm2) tensión (kg/mm2)
Tubo 1 n1 = 10 𝑥ҧ1 = 87,6 𝑠1 =1,09
Tubo 2 n2 = 12 𝑥ҧ2 = 74,5 𝑠2 = 1,5
Si µ1 −µ2 representan los promedios verdaderos de las resistencias a la tensión para las dos
clases de tubos, encuentre un intervalo de confianza del 90% para la diferencia de las medias
µ1 − µ2 .
Segundo caso: varianzas poblacionales σ𝟐𝟏 𝒚 σ𝟐𝟐 iguales, desconocidas y muestras
pequeñas
Tratamos ahora el caso en el cual los tamaños muestrales no son grandes y se requiere un
intervalo de confianza para la diferencia de medias de dos poblaciones normales. De hecho,
cuando las varianzas poblacionales son desconocidas, este problema resulta difícil de abordar
de forma general. Sin embargo, en los casos especiales en los que se pueda asumir que las
varianzas poblacionales son iguales, se puede utilizar el siguiente teorema:
Teorema:
Sean 𝑥ҧ1 y 𝑥ҧ2 las medias de muestras aleatorias independientes de tamaños 𝑛1 < 30 y 𝑛2 < 30
de poblaciones normales con medias µ1 𝑦 µ2 y varianzas σ𝟐𝟏 𝒚 σ𝟐𝟐 iguales y desconocidas.
Entonces, un intervalo de confianza de (1 − α)100% para es µ1 − µ2 es:
𝑠2 𝑠2 𝑠2 𝑠2
[(𝑥ҧ1 -𝑥ҧ2 )- 𝑡α + <µ1 − µ2 < (𝑥ҧ1 -𝑥ҧ2 ) + 𝑡α + ]
2 𝑛1 𝑛2 2 𝑛1 𝑛2
Donde:
2 𝑛1 −1 𝑠12 +(𝑛2 −1)𝑠22 𝑥ҧ 1 −𝑥ҧ 2 −( µ1 − µ2 )
𝑆 = y 𝑡α es el valor de t =
𝑛1 +𝑛2 −2 2 𝑠2 𝑠2
+
𝑛1 𝑛2
α
que deja un área de a la derecha de la distribución t de Student con ν = 𝑛1 + 𝑛2 − 2 grados
2
de libertad.
Ejemplo:
En un estudio sobre los efectos de la planificación en el rendimiento financiero de los bancos,
se extrajo una muestra aleatoria de seis instituciones financieras que contaban con un sistema
de planificación formal, y se comprobó que el porcentaje medio anual de crecimiento de los
ingresos netos en dicha muestra era de 9,972 con una desviación típica de 7,470. La media de
dicho crecimiento en otra muestra aleatoria independiente de nueve bancos que no recurrían a
la planificación fue de 2,098 con una desviación típica de 10,834. Suponiendo que las dos
poblaciones son normales y tienen la misma varianza, calcular un intervalo de confianza del
90% para la diferencia de medias
SOLUCION:
Los datos muestrales son:
𝑛1 = 6, 𝑥1ҧ = 9,972, 𝑠1 = 7,470;
𝑛2 = 9, 𝑥ҧ2 = 2,098, 𝑠2 = 10,834.
Claramente podemos verificar que se cumplen los supuestos del teorema.
Debido a que el valor de la varianza muestral combinada es:
5 (7,470)2 +(8)(10.834)2
2
𝑆 = = 93,7
13
y a que
𝑖α = 𝑡0,05 = 1,771 es el valor de una variable aleatoria que tiene distribución t de
2
Student con ν = 𝑛1 + 𝑛2 − 2 = 13 grados de libertad, entonces, el intervalo de
confianza del 90% para la diferencia de los incrementos medios porcentuales
es:
93,7 93,7 93,7 93,7
[(9,972 − 2,098) − 1,771 + <µ1 − µ2 < (9,972 − 2,098) − 1,771 + ]
6 9 6 9
o bien
[−1,161 <µ1 − µ2 < 16,909].
El intervalo incluye el cero, lo cual sugiere que no existe evidencia suficiente en la muestra
como para rechazar la idea de la igualdad de medias entre ambas poblaciones.
Ejercicio propuesto:
Un biólogo deseaba estudiar los efectos de ciertas drogas sobre el consumo de agua en una especie
particular de animales de laboratorio. La droga A que contiene un agente que produce sed, se administró a
una muestra aleatoria simple de 𝑛𝐴 = 25 animales. La droga B que no contiene tal agente, se administró a
una muestra aleatoria independiente de 𝑛𝐵 = 22 animales similares. El biólogo registro´ la cantidad de agua
consumida por cada animal durante un periodo de tiempo determinado después de la administración de las
drogas. Las cantidades promedio de agua consumida por animal en cada uno de los dos grupos fueron
respectivamente de 𝑥𝐴ҧ = 50 mililitros (ml) y 𝑥ҧ𝐵 = 25 ml y las desviaciones típicas de 𝑠𝐴 = 5,3 ml y de 𝑠𝐵 = 5,6
ml. Construya un intervalo de confianza del 95% para µ1 − µ2 suponiendo que las poblaciones en cuestión
son normales con varianzas iguales.
Tercer caso: varianzas poblacionales σ𝟐𝟏 𝒚 σ𝟐𝟐 diferentes, desconocidas y muestras pequeñas
Teorema:
Sean 𝑥ҧ1 y 𝑥ҧ2 las medias de muestras aleatorias independientes de tamaños 𝑛1 < 30 y 𝑛2 < 30
de poblaciones normales con medias µ1 𝑦 µ2 y varianzas σ𝟐𝟏 𝒚 σ𝟐𝟐 diferentes y desconocidas.
Entonces, un intervalo de confianza de (1 − α)100% para es µ1 − µ2 es:
𝑠12 𝑠22 𝑠12 𝑠22

[(𝑥ҧ1 -𝑥ҧ2 )- 𝑡α + < µ1 − µ2 < (𝑥ҧ1 -𝑥ҧ2 )- 𝑡α + ]
2 𝑛1 𝑛2 2 𝑛1 𝑛2
Donde:
𝑥ҧ 1 −𝑥ҧ 2 −( µ1 − µ2 )
𝑡α es el valor de t =
2 𝑠2 2
1 + 𝑠2
𝑛1 𝑛2
α
que deja un área de a la derecha de la distribución t de Student con:
2
𝑠2 2 2
1 + 𝑠2
𝑛1 𝑛2
v= 2 2 , grados de libertad. Dado que ν rara vez es un entero, se redondea al entero más
𝑠2
1 𝑠2
2
𝑛1 𝑛2
+
𝑛1 −1 𝑛2 −1
cercano.
Ejemplo:
El departamento de zoología de cierto instituto llevó a cabo un estudio para estimar la diferencia
en la cantidad de cierta sustancia química medida en dos estaciones diferentes de un río. La
sustancia se mide en miligramos por litro. Se reunieron 15 muestras de la estación 1 y 12
muestras de la estación 2. Las 15 muestras de la estación 1 tuvieron un contenido promedio de
sustancia química de 3,84 miligramos por litro y una desviación estándar de 3,07 miligramos por
litro, mientras que las 12 muestras de la estación 2 tuvieron un contenido promedio de 1,49
miligramos por litro y una desviación estándar de 0,80 miligramos por litro. Encuentre un
intervalo de confianza del 95% para la diferencia en el contenido promedio real de sustancia en
estas dos estaciones. Suponga que las observaciones vienen de poblaciones normalmente
distribuidas con varianzas diferentes.
SOLUCION:
Tenemos que
𝑛1 = 15, 𝑥ҧ1 = 3,84, 𝑠1 = 3,07,
𝑛2 = 12, 𝑥ҧ2 = 1,49, 𝑠2 = 0,80.
Como las varianzas poblacionales se suponen diferentes, sólo podemos encontrar un intervalo
de confianza de 95% aproximado basado en la distribución t de Student con:
2
3,07 2 0.80 2
+
15 12
v= 2 2 = 16,2 ~ 16
3.07 2 0,80 2
15 12
+
14 11
grados de libertad. Debido a que 𝑡α = 𝑡0,025 = 2,120 para ν = 16 grados de libertad,

2
entonces, el intervalo buscado es:
3,07 2 0,80 2 3,07 2 0,80 2
[(3,84-1,492 )- 2,120 + < µ1 − µ2 < (3,84-1,492 ) + 2,120 + ]
15 12 15 12
o bien
0,60 < µ1 − µ2 < 4,10.
Por ello tenemos una confianza del 95% de que el intervalo de 0,60 a 4,10 miligramos por litro
contiene la diferencia de los contenidos promedio reales de sustancia para estos dos lugares.
Como el 0 no está incluido en el intervalo, podemos afirmar que estos dos contenidos promedios
son diferentes.
Intervalos de confianza para la varianza
Hay problemas prácticos en donde se requieren estimaciones por intervalos para la varianza de
la población. Como se podría intuir, tales estimaciones están basadas en la varianza muestral
como se muestra en el siguiente teorema.
Teorema:
Si 𝑠 2 es la varianza de una muestra aleatoria de tamaño n, tomada de una población distribuida
normalmente con media µ y varianza σ2 , entonces, un intervalo de confianza de (1 − α)100%
para σ2 es:
(𝑛−1)𝑠 2 (𝑛−1)𝑠 2
[ < σ2 < ]
𝛘2α 𝛘2 α
1− 2
2
α
Donde: 𝛘2α y 2
𝛘1−α son los valores de una variable aleatoria que deja un área de
2
2 2
α
y 1− 2, respectivamente, a la derecha de la distribución 𝛘2 con n − 1 grados de libertad.
Ejemplo:
Una muestra aleatoria de tabletas para el dolor de estómago tiene una desviación típica de 0,8%
en la concentración del ingrediente activo. Hallar un intervalo de confianza del 90% para la
varianza y para la desviación poblacional.
Solución:
Tenemos que n = 15 y s = 0,8.
Debido a que 𝛘2α = 𝛘20,05 = 23,68 y 𝛘1−
2 2
α = 𝛘0,95 = 6,57 con ν = n − 1 = 14 grados de libertad, por el
2 2
teorema, el intervalo de confianza del 90% para la varianza poblacional viene dado por:
(14)0.82 2 (14)0.82
[ <σ < ]
23.68 6.57
[0.378 < σ2 < 1.364 ]

Por consiguiente, con una confianza del 90%, la varianza poblacional de la concentración del
ingreso activo está entre 0,378 y 1,364.
Dado que la desviación típica es igual a la raíz cuadrada, podemos obtener un intervalo de
confianza del 90% para la desviación típica poblacional tomando raíces cuadradas. El resultado
es:
[0,61 < σ < 1,17].
Por tanto, nuestro intervalo de confianza del 90% para la desviación típica poblacional de la
concentración porcentual del ingrediente activo de estas tabletas va del 61% al 117%.
Ejemplo propuesto:
Un fabricante de detergente liquido está interesado en la uniformidad de la máquina utilizando
para llenar las botellas. De manera específica, es deseable que la desviación estándar σ del
proceso de llenado sea menor que 0,5 onzas de liquido. De otro modo, existe un porcentaje
mayor del deseable de botellas con un contenido menor de detergente. Supóngase que la
distribución del volumen de llenado es aproximadamente normal. Al tomar una muestra aleatoria
de 20 botellas, se obtiene una varianza muestral 𝑠 2 = 0,00153 (onzas de fluido)2. Calcule un
intervalo de confianza del 90% para σ.
Intervalos de confianza para la razón de dos varianzas
𝑠12
Ya hemos explicado en capítulos anteriores que la razón entre las dos varianzas muestrales
𝑠22
σ21
𝑠12 y 𝑠22 proporciona un estimador puntual de que es la razón entre dos varianzas
σ22
poblacionales. Hay muchas situaciones en que uno quisiera saber si las varianzas poblacionales
son iguales o no. Un camino para determinar este hecho es construyendo un intervalo de
confianza para la razón de las dos varianzas poblacionales y ver si el 1 se encuentra o no en el
intervalo.
El siguiente teorema nos muestra como construir tales intervalos.
Teorema:
Si 𝑠12 y 𝑠22 son las varianzas de muestras aleatorias independientes de tamaño 𝑛1 𝑦 𝑛2 tomadas
de poblaciones normales con varianzas σ12 𝑦 σ12 , respectivamente, entonces, un intervalo de
confianza de (1 − α)100% para σ12 𝑦 σ12 es:
𝑠12 1 σ21 𝑠12
< < 𝐹α
𝑠22 𝐹α σ22 𝑠22 2 (𝑣2 ;𝑣1 )
2 (𝑣1 ;𝑣2 )
α
Donde 𝐹α(𝑣 es el valor de una variable aleatoria que deja un área de a la derecha de la
2 1 ;𝑣2 ) 2
distribución F con 𝑣1 = 𝑛1 − 1y 𝑣2 = 𝑛2 − 1 grados de libertad.
Ejemplo:
Una compañía fabrica propulsores para uso en motores de turbinas. Una de las operaciones
consiste en esmerilar el terminado de una superficie particular con aleación de titanio. Pueden
emplearse dos procesos de esmerilado, y ambos pueden producir partes que tienen la misma
rigurosidad superficial promedio. Al ingeniero de manufactura le gustaría seleccionar el proceso
que tenga la menor variabilidad en la rigurosidad de la superficie. Para ello toma una muestra
de 𝑛1 = 12 partes del primer proceso, la cual tiene una desviación estándar muestral de 𝑠1 = 5.1
micro pulgada, y una muestra aleatoria de 𝑛2 = 15 partes del segundo proceso, la cual tiene una
desviación estándar muestral de 𝑠2 = 4.7 micro pulgadas. Se desea encontrar un intervalo de
σ21
confianza del 90% para el cociente de las dos varianzas .
σ22
Suponga que los procesos son independientes y que la rigurosidad de la superficie está
distribuida normalmente.
SOLUCIÓN:
Para un intervalo de confianza del 90%, α = 0.1. Por lo tanto, 𝐹0.05; 14,11 = 2,564 y𝐹0.05; 11,14 =
σ21
2,74. Por tanto, el intervalo de confianza del 90% para , es:
σ22
5.12 1 σ21 5.12

< < . 2.74
4.72 2,564 σ22 4.72
De donde
σ21
[ 0.46 < < 3,23]
σ22
Puesto que este intervalo de confianza incluye la unidad, no es posible afirmar que las
desviaciones estándar de la rigurosidad de la superficie de los dos procesos sean diferentes con
un nivel d confianza del 90%.
GRACIAS

Diapositiva de Estimacion

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Diapositiva de Estimacion

Uploaded by

Copyright:

Available Formats

TEORIA DE ESTIMACION

MGc. KENNEDY HURTADO IBARRA

2. Desarrollar estimaciones de intervalos de conﬁanza para la

3. Determinar el tamaño de la muestra necesario para obtener un

Deﬁnición: Estimación estadística

Para estudiar la estimación de un parámetro desconocido, debemos considerar

b. Estimador = med, estimación med = (27,94-27,98)/ 2 = 27,96

No importa cuál sea el valor verdadero de p, la distribución del estimador 𝑝Ƹ

Dms. Para cualquier variable aleatoria Y, V(Y) = E 𝑌 2 - [ E 𝑌 ]2 , por lo tanto;

1. La media muestral cuando la muestra proviene de una distribución normal

2. La varianza muestral cuando la muestra proviene de una distribución normal.

1. La proporción muestral binomial.

Supongamos que un control realizado sobre una muestra aleatoria de piezas

Un estimador por intervalos de un parámetro poblacional es un estadístico para

Si se extraen repetidamente muestras de la población y se calculan los

En la sección anterior mostramos que el valor de la media muestral x da como

Un fabricante produce bolsas de arroz. El peso del contenido de estas bolsas

[94,1 < µ < 105,88]

El siguiente teorema nos sugiere utilizar la distribución t de Student para derivar

Debido a que 𝑡α = 𝑡0´025 = 2,447, el intervalo buscado será:

[ 9,74 < µ < 10,26 ]

Supongamos que estamos interesados ahora en la proporción de

0,12 (0,88) 0,12 (0,88)

[0,05 < p < 0,19]

Las empresas de búsqueda de ejecutivos se especializan en ayudar a las empresas a ubicar y

Donde, 𝑧α es el valor de:

(1,09)2 (1,01)2 (1,09)2 (1,01)2

𝑠12 𝑠22 𝑠12 𝑠22

grados de libertad. Debido a que 𝑡α = 𝑡0,025 = 2,120 para ν = 16 grados de libertad,

[0.378 < σ2 < 1.364 ]

[0,61 < σ < 1,17].

5.12 1 σ21 5.12

You might also like