You are on page 1of 6

Estadstica I

Tecnicatura Universitaria en Logstica


UNViMe

INFERENCIA ESTADISTICA

Objetivo: extraer conclusiones acerca de una poblacin basndose en los datos proporcionados por una muestra.
Debemos tener en cuenta que en el proceso de generalizacin (m P) podemos llegar a cometer errores, los que
pueden ser medidos en trminos de probabilidad.

Ramas (pilares) de la inferencia Estadstica:

1. Estimacin de Parmetros.
2. Prueba de Hiptesis.

Estimacin de Parmetros
2 Formas:
1. Estimacin Puntual
2. Estimacin por Intervalo

Estimacin Puntual:
Estimador: Es una regla que nos dice como calcular la estimacin de un parmetro basndonos en la informacin
contenida en una muestra.
La distribucin en el muestreo de un estadstico es la distribucin de los valores que toma el estadstico en todas las
muestras posibles del mismo tamao obtenidas de una poblacin. Si bien los valores del estadstico varan de muestra
en muestra, la conducta del estadstico con en las sucesivas repeticiones de seleccin de muestras, es regular y
predecible. La distribucin en el muestreo describe este patrn regular de conducta y su conocimiento es fundamental
en la aplicacin de la inferencia estadstica. Para que los estadsticos tengan una conducta regular y predecible, es
necesario que las muestras sean seleccionadas aleatoriamente.
Los estadsticos obtenidos aleatoriamente tienen poco o ningn sesgo (Sesgo = E( ) - ). La aleatorizazcion produce una
distribucin en el muestreo que elimina el sesgo.
La variabilidad de un estadstico (al sesgo) se describe por la dispersin de su distribucin en el muestreo. Se controla
por medio del tamao de la muestra. A medida que aumenta el tamao de la muestra disminuye la variabilidad del
estadstico.

Propiedades de los buenos Estimadores


No se puede evaluar la bondad de un procedimiento de estimacin sobre la base de un solo resultado.
Podemos evaluar la bondad del estimador construyendo una distribucin de frecuencias de las estimaciones al repetirse
el muestreo y observando en qu forma se centra la distribucin alrededor del parmetro.
I. Insesgabilidad
Un estimador es insesgado si la esperanza de su distribucin en el muestreo es igual al verdadero valor del
parmetro que estima.
Si E(a)=, entonces a es un estimador insesgado.
Si E(a)= + K, entonces a es un estimador sesgado y K= magnitud del sesgo.
=parmetro, a= estimador

Recordando:

E ( )=

1
Estadstica I
Tecnicatura Universitaria en Logstica
UNViMe

E (p)=P
n
E (S2 )= 2 Si S 2 ( xi x ) 2 (n 1)
i 1

En cambio:
n
S 2 ( xi x ) 2 n
i 1

Tenemos un estimador sesgado de la varianza.

E (S2 )= 2 (

II. Consistencia
Un estimador es consistente cuando al tomar muestras grandes, existe la certeza de que el valor estimado se
aproxima al parmetro. La ley de los grandes nmeros establece la consistencia de la media y la proporcin
muestral al enunciar que la probabilidad de que el estimador difiera del parmetro en una cierta cantidad es
igual a 0 cuando n tiende a infinito (n).
III. Eficiencia
Si tenemos dos estimadores insesgados: a y b, a es MAS EFICIENTE que b, para estimar el parmetro si la
varianza de a es menor a la varianza de b. [V(a) < V (b)].
Estimacin por Intervalos:
Intervalo de Confianza= Estimador Margen de Error

El margen de error muestra cun exacta es nuestra estimacin basndose en la variabilidad del estimador. El nivel de
confianza (1-) muestra cun confiable es el procedimiento para capturar el verdadero valor del parmetro poblacional.
El parmetro poblacional es un valor constante, desconocido pero fijo en algn lugar de la distribucin de probabilidad
poblacional correspondiente a la variable que se est estudiando.

En la Estimacin por Intervalos lo que cambia son los extremos del intervalo, pues su construccin depende de una
variable aleatoria que cambia de valor en funcin de los elementos que fueron seleccionados en la muestra. Entonces,
la probabilidad en la estimacin por intervalos de un parmetro poblacional es la probabilidad de que un intervalo
contenga al parmetro y no de la probabilidad de que el parmetro caiga en un intervalo determinado.

El parmetro es una cantidad desconocida pero fija, el intervalo es aleatorio.

Si, = parmetro, 1-= nivel de confianza elegida, entonces podemos definir:

Un intervalo con confianza 1- es un intervalo computado a partir de datos mustrales por medio de un mtodo que
establece una probabilidad 1- de que el intervalo contenga el verdadero valor del parmetro .

*Los intervalos de confianza fueron desarrollados por Jerry Neyman en 1937.

2
Estadstica I
Tecnicatura Universitaria en Logstica
UNViMe

Estimacin de intervalo de confianza para la:


Media Poblacional Proporcin
Poblacional
Conocida Desconocida Limites del intervalo
Limites del intervalo usando la Limites del intervalo usando la distribucin t: usando la distribucin
distribucin z: z:

g l: n - 1

Nota: Si la poblacin no tiene una Nota: Cuando se desconoce , pero se puede suponer que la Nota: Se asume que
distribucin Normal, n debe ser mayor poblacin en cuestin tiene una distribucin np y n(1-p) son 5.
o igual que 30 para que se aplique el aproximadamente normal, el uso de la distribucin t es una
TCL. necesidad si n <30.

ESTIMACIN POR INTERVALOS DEL PARMETRO MEDIA POBLACIONAL.


Recordando, segn lo que estable el Teorema Central de Limite:

~ N (, /n),

Para poder calcular probabilidades para la variable aleatoria media muestral debemos estandarizarla:

Z= ( -)/ (/n) ~ N (0, 1); Z es una variable normal estandarizada.

Deberemos encontrar dos valores: Z1 y Z2 tal que: P (Z1 Z Z2) = 1 .

Z1 es el valor de la variable normal estandarizada que acumula una probabilidad

igual a /2 y Z2 es un valor de la variable que acumula una probabilidad igual a 1- /2.

Debemos despejar convenientemente para que en el centro del intervalo quede el parmetro que deseamos estimar:

P (-Z (-)/ (/n) Z) = 1

P (-Z (/n) - Z (/n) = 1

P (-Z (/n)- - Z (/n) - = 1 ; Multiplicamos toda la desigualdad por -1, y debido a ello cambia el sentido de la

desigualdad.

P ( - Z (/n) +Z (/n) = 1

3
Estadstica I
Tecnicatura Universitaria en Logstica
UNViMe

En este intervalo, el problema que se presenta es , la desviacin estndar poblacional. En una situacin real es una

parmetro desconocido, que debe ser estimado y su estimador lgico ser S la desviacin estndar de la muestra. Si el

tamao de la muestra es grande (n> 30), no hay problema de seguir utilizando a la distribucin normal para medir la

confianza de la estimacin. Si la muestra es chica, para calcular la confianza del estimador utilizaremos a la distribucin t

de Student.

Precisin de la Estimacin: Si llamamos b al extremo superior del intervalo y a al extremo inferior, la diferencia b-

a nos dar una idea de la precisin de la estimacin. Una estimacin por intervalo tiene sentido solo si es lo

suficientemente precisa. La precisin es directamente proporcional al tamao de la muestra e inversamente

proporcional a la desviacin estndar o s.

Ejemplo Practico: A partir de experiencias anteriores, se encontr que la desviacin estndar de la poblacin de los
dimetros de las varillas producida por una maquina es = 0,053 pulgadas. Para una muestra aleatoria simple de n= 30
varillas se encontr que el dimetro promedio es = 1,400 pulgadas. Cual es el intervalo de confianza de 95% para la
media de la poblacin?

L.I.= 1,381

L.S.= 1,419

Prueba de Hiptesis:

Metodologa de una Prueba de Hiptesis: La hiptesis se escribe en trminos del parmetro de la poblacin.

La base terica de la prueba de hiptesis: Ho es verdadera hasta que las evidencias, los resultados de los datos
obtenidos de la muestra determinen que es falso. Si la Ho es falsa, otra es la verdadera. Se est en presencia de
laH1Que debe ser verdadera si la Ho es falsa

La hiptesis alternativa representa la conclusin a la que se llegara si hubiera suficiente evidencia de la informacin de
la muestra para decidir que es improbable que la hiptesis nula sea verdadera y por lo tanto rechazarla.

Nota: No rechazar la H0 no es una prueba de que la H1 sea verdadera. Nunca se puede probar que esa hiptesis es
verdadera, porque estamos basando nuestra decisin nicamente en informacin basada en una muestra y no con la
poblacin entera.

Regin de rechazo y regin de no rechazo: La distribucin de muestreo de la estadstica de prueba se divide en dos
regiones, la regin de rechazo, tambin denominada regin crtica y una regin de no rechazo. Si la estadstica de
prueba cae en la regin de no rechazo, no se puede rechazar la hiptesis nula, por el contrario si cae en la regin de
rechazo la hiptesis nula es rechazada. La regin de rechazo puede considerarse como el conjunto de valores de la

4
Estadstica I
Tecnicatura Universitaria en Logstica
UNViMe

estadstica de prueba que no tienen la posibilidad de presentarse si la H0 es verdadera. Por otro lado, estos valores no
son tan improbables de presentarse si la H0 es falsa.

Con el fin de tomar una decisin con respecto a la H0 primero se debe determinar el valor crtico de la estadstica de
prueba. Este valor divide en dos zonas, la de rechazo de la de no rechazo, y ello est ntimamente ligado con el riesgo
que implica tomar decisiones sobre la poblacin a partir de valores mustrales.

Error de Tipo I se rechaza la Ho cuando en realidad es cierta. A la probabilidad de un error de Tipo I () se le denomina
tambin nivel de significacin.

Error de Tipo II se da si no se rechaza la H0 cuando en realidad es falsa y se debiera rechazar. El error de Tipo II ocurre
con una probabilidad ()

Prueba de Hiptesis y toma de decisiones


Situacin Real:
Decisin Estadstica:
H0 Verdadera H0 Falsa
No Rechazo H0 1- Error de Tipo II:
Rechazo H0 Error de Tipo I: 1-

Pasos de una prueba de hiptesis:

1. Expresar la Hiptesis Nula: H0

2. Expresar la Hiptesis Alternativa: H1

3. Seleccionar el nivel de significacin:

4. Seleccionar el tamao de la muestra: n

5. Determinar la tcnica estadstica apropiada y la prueba estadstica correspondiente a utilizar

6. Establecer los valores crticos que determinan la regin de rechazo y de no rechazo

7. Recopilar los datos y calcular el valor muestral de la prueba estadstica apropiada

8. Determinar si la prueba estadstica ha cado en la regin de rechazo o en la de no rechazo.

9. Tomar la decisin estadstica

10. Expresar la decisin estadstica en trminos del problema

Ejemplo Prctico: Prueba de dos colas para la media y conocida

Cuando una soldadora robot esta ajustada, la media del tiempo necesario para efectuar su tarea es de 1,325 minutos.
Experiencias anteriores han demostrado que la desviacin estndar del tiempo del ciclo es de 0,0396 minutos. Una
media del tiempo de operacin incorrecta puede afectar la eficiencia de otras actividades a lo largo de la lnea de
produccin. Para una muestra aleatoria reciente de 80 trabajos, la media del tiempo del ciclo para la soldadora fue de
1,3229 minutos. Necesita la maquina un ajuste?
5
Estadstica I
Tecnicatura Universitaria en Logstica
UNViMe

H0: = 1,325 La maquina esta ajustada

H1: 1,325 La maquina no esta ajustada

= 0,05


z= = = -0,47

Valores crticos: z =

You might also like