You are on page 1of 11

INFERENC

IA
ESTADIST
ICA
Br. Xiu Castillo Gilberto
Kely
PROBABILIDAD Y ESTADISTICA
UNIDAD 4
2C Ing. Civil
02/06/15

Prof.:
Ing. Pastor Manuel
Daz Alcocer

INFERENCIA ESTADSTICA
Estimacin puntual y por intervalos de confianza.
Estimacin
Cuando queremos realizar un estudio de una poblacin cualquiera de la que
desconocemos sus parmetros, por ejemplo su media poblacional o la
probabilidad de xito si la poblacin sigue una distribucin binomial, debemos
tomar una muestra aleatoria de dicha poblacin a travs de la cual calcular una
aproximacin a dichos parmetros que desconocemos y queremos estimar. Bien,
pues esa aproximacin se llama estimacin. Adems, junto a esa estimacin, y
dado que muy probablemente no coincida con el valor real del parmetro,
acompaaremos el error aproximado que se comete al realizarla.

Estimacin Puntual
Una estimacin puntual del valor de un parmetro poblacional desconocido (como
puede ser la media , o la desviacin estndar ), es un nmero que se utiliza
para aproximar el verdadero valor de dicho parmetro poblacional. A fin de realizar
tal estimacin, tomaremos una muestra de la poblacin y calcularemos el
parmetro muestral asociado (x para la media, s para la desviacin estndar, etc.).
El valor de este parmetro muestral ser la estimacin puntual del parmetro
poblacional.
Por ejemplo, supongamos que la compaa Sonytron desea estimar la edad media
de los compradores de equipos de alta fidelidad. Seleccionan una muestra de 100
compradores y calculan la media de esta muestra, este valor ser un estimador
puntual de la media de la poblacin.

Qu propiedades debe cumplir todo buen estimador?


Insesgado: Un estimador es insesgado cuando la media de su distribucin
muestral asociada coincide con la media de la poblacin. Esto ocurre, por ejemplo,
con el estimador x, ya que x = y con estimador p ya que p
De varianza mnima: La variabilidad de un estimador viene determinada por el
cuadrado de su desviacin estndar. En el caso del estimador x, su desviacin
estndar es x = / n , tambin llamada error estndar de .

p( 1 p )
En el caso del error estndar de p, p =
n
Observar que cuanto mayor sea el tamao de la muestra n, menor ser la
variabilidad del estimador

y de p, por tanto, mejor sern nuestras

estimaciones.

Por intervalos de confianza.


Dada una poblacin X, que sigue una distribucin cualquiera con media y
desviacin estndar .

1. Sabemos (por el TCL) que, para valores grandes de n, la media muestral


X sigue una distribucin aproximadamente normal con media x = y
desviacin estndar

o x = o / n

2. Por otra parte, el Teorema de Chebyshev nos dice que, en una distribucin
normal, aproximadamente un 95% de los datos estaban situados a una
distancia inferior a dos desviaciones estndar de la media.

De lo anterior se deduce que: ( 2 o x < x< + 2 o x

) = 0,95

Por tanto, sta ltima frmula nos da un intervalo de valores tal que la probabilidad
de que la media de la poblacin est contenida en l es de 0,95. Este tipo de
intervalos se llaman intervalos de confianza de un parmetro poblacional. El nivel
de confianza (1 - ) del intervalo es la probabilidad de que ste contenga al
parmetro poblacional. En el ejemplo anterior, el nivel de confianza era del 95%(
= 0,05).

EJEMPLO:
Se seleccionaron al azar 15 resistores de la produccin de un proceso. La
resistencia media observada en la muestra fue de 9.8 ohms, mientras que la
desviacin estndar muestral fue de 0.5 ohms. Determine un intervalo de
confianza del 95% para la resistencia media poblacional. Se supone que la
variable en estudio tiene distribucin normal.
Si

X y s son la media aritmtica y la desviacin estndar observada en una

muestra de tamao n, de una variable X con distribucin normal y variancia

desconocida, entonces un intervalo de confianza para X = E(X) del 100(1) %


est dado por

Para = 0.05 se obtiene de la tabla el valor t = 2.145 resultando el intervalo de


confianza para X:

Estimacin de la media, de la diferencia de medias, de la


proporcin y de la diferencia de proporciones.

Estimacin de la media
Para estimar la media poblacional por medio de intervalos de confianza, ser
necesario recordar que el Teorema Central del Lmite nos daba informacin de
cmo se hallaban distribuidas las medias mustrales: "normalmente" con una
media igual a la de la poblacin original m (que es la que ahora tratamos de
conocer) y desviacin tpica
Supongamos que hemos analizado la muestra ya nombrada de media Km., y que
sabemos que la desv.Tpica de la poblacin es de s=0.4 km., y que nos
planteamos estimar la media de todo el instituto, con un nivel de confianza del
95% .El proceso para realizar la estimacin es el siguiente:
Sabemos por el T.C.L. que las medias mustrales se distribuyen segn
La siguiente figura nos ilustrar:

Hallamos el valor k de forma que p (-k<Z<k)=0.95, o lo que es lo mismo p


(Z<k)=0,975. Consultando nuestra tabla de la distribucin normal, encontraremos
que k=1.96

Estimacin de la diferencia de medias

Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y 22,


respectivamente, un estimador puntual de la diferencia entre 1 y 2 est dado por la
estadstica. Por tanto. Para obtener una estimacin puntual de 1- 2, se
seleccionan dos muestras aleatorias independientes, una de cada poblacin, de
tamao n1 y n2, se calcula la diferencia, de las medias mustrales.
Recordando a la distribucin muestral de diferencia de medias:
Al despejar de esta ecuacin 1- 2 se tiene:
En el caso en que se desconozcan las varianzas de la poblacin y los tamaos de
muestra sean mayores a 30 se podr utilizar la varianza de la muestra como una
estimacin puntual.

Ejemplo:
Se lleva a cabo un experimento en que se comparan dos tipos de motores, A y B.
Se mide el rendimiento en millas por galn de gasolina. Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B. La gasolina que se
utiliza y las dems condiciones se mantienen constantes. El rendimiento promedio
de gasolina para el motor A es de 36 millas por galn y el promedio para el motor
B es 24 millas por galn. Encuentre un intervalo de confianza de 96% sobre la
diferencia promedio real para los motores A y B. Suponga que las desviaciones
estndar poblacionales son 6 y 8 para los motores A y B respectivamente.

Solucin:
Es deseable que la diferencia de medias sea positiva por lo que se recomienda
restar la media mayor menos la media menor. En este caso ser la media del
motor B menos la media del motor A.
El valor de z para un nivel de confianza del 96% es de 2.05
3.43<B-A<8.57
La interpretacin de este ejemplo sera que con un nivel de confianza del 96% la
diferencia del rendimiento promedio esta entre 3.43 y 8.57 millas por galn a favor
del motor B. Esto quiere decir que el motor B da ms rendimiento promedio que el
motor A, ya que los dos valores del intervalo son positivos.

Estimacin de la proporcin y de la diferencia de proporciones


Muchas aplicaciones involucran poblaciones de datos cualitativos que deben
compararse utilizando proporciones o porcentajes. A continuacin se citan algunos
ejemplos:
Educacin.- Es mayor la proporcin de los estudiantes que aprueban
matemticas que las de los que aprueban ingls?
Medicina.- Es menor el porcentaje de los usuarios del medicamento A que
presentan una reaccin adversa que el de los usuarios del frmaco B que
tambin presentan una reaccin de ese tipo?
Administracin.- Hay diferencia entre los porcentajes de hombres y
mujeres en posiciones gerenciales.

Ingeniera.- Existe diferencia entre la proporcin de artculos defectuosos


que genera la mquina A los que genera la mquina B?
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos
proporciones mustrales, la distribucin muestral de diferencia de proporciones es
aproximadamente normal para tamaos de muestra grande (n 1p15, n1q15, n2p25 y
n2q25). Entonces p1 y p2 tienen distribuciones mustrales aproximadamente
normales, as que su diferencia p1-p2 tambin tiene una distribucin muestral
aproximadamente normal.
Ejemplo:
Se considera cierto cambio en un proceso de fabricacin de partes componentes.
Se toman muestras del procedimiento existente y del nuevo para determinar si
ste tiene como resultado una mejora. Si se encuentra que 75 de 1500 artculos
del procedimiento actual son defectuosos y 80 de 2000 artculos del procedimiento
nuevo tambin lo son, encuentre un intervalo de confianza de 90% para la
diferencia real en la fraccin de defectuosos entre el proceso actual y el nuevo.
Solucin:
Sean P1 y P2 las proporciones reales de defectuosos para los procesos actual y
nuevo, respectivamente. De aqu, p1=75/1500 = 0.05 y p2 = 80/2000 = 0.04. Con
el uso de la tabla encontramos que z para un nivel de confianza del 90% es de
1.645.
-0.0017<P1-P2<0.0217
Como el intervalo contiene el valor de cero, no hay razn para creer que el nuevo
procedimiento producir una disminucin significativa en la proporcin de artculos
defectuosos comparado con el mtodo existente.

Determinacin del tamao de la muestra.


Al iniciar cualquier investigacin, la primera pregunta que surge es: de qu
tamao debe ser la o las muestras? La respuesta a esta pregunta la veremos en
esta seccin, con conceptos que ya se han visto a travs de este material.
Clculo del tamao de la muestra para estimar una media
Qu tan grande debe ser una muestra si la media muestral se va a usar para
estimar la media poblacional? La respuesta depende del error estndar de la
media, si este fuera cero, entonces se necesitara una sola media que ser igual
necesariamente a la media poblacional desconocida, porque = 0. Este caso
extremo no se encuentra en la prctica, pero refuerza el hecho de que mientras
menor sea el error estndar de la media, menor es el tamao de muestra
necesario para lograr un cierto grado de precisin.
Se estableci antes que una forma de disminuir el error de estimacin es
aumentar el tamao de la muestra, si ste incluye el total de la poblacin,
entonces sera igual a cero. Con esto en mente, parece razonable que para un
nivel de confianza fijo, sea posible determinar un tamao de la muestra tal que el
error de estimacin sea tan pequeo como queramos, para ser ms preciso, dado
un nivel de confianza y un error fijo de estimacin, se puede escoger un tamao
de muestra n tal que P () = Nivel de confianza. Con el propsito de
determinar n. El error mximo de estimacin.

Una frmula muy extendida que orienta sobre el clculo del tamao de la muestra
para datos globales es la siguiente:
n= ((k^2)*N*p*q)/ ((e^2*(N-1))+ ((k^2)*p*q))
N: es el tamao de la poblacin o universo (nmero total de posibles
encuestados).
k: es una constante que depende del nivel de confianza que asignemos. El
nivel de confianza indica la probabilidad de que los resultados de nuestra
investigacin sean ciertos: un 95,5 % de confianza es lo mismo que decir
que nos podemos equivocar con una probabilidad del 4,5%.
Los valores k ms utilizados y sus niveles de confianza son: k 1,15 1,28 1,44 1,65
1,96 2 2,58 Nivel de confianza 75% 80% 85% 90% 95% 95,5% 99% (Por tanto si
pretendemos obtener un nivel de confianza del 95% necesitamos poner en la
frmula k=1,96) e: es el error muestral deseado. El error muestral es la diferencia
que puede haber entre el resultado que obtenemos preguntando a una muestra de
la poblacin y el que obtendramos si preguntramos al total de ella.
Altos niveles de confianza y bajo margen de error no significan que la encuesta
sea de mayor confianza o est ms libre de error necesariamente; antes es
preciso minimizar la principal fuente de error que tiene lugar en la recogida de
datos.

Ejemplo:

You might also like