Professional Documents
Culture Documents
=
N
i
i
N
x
1
, la media poblacional.
Un parmetro describe parcial o completamente- la distribucin de probabilidad de la variable de
inters en una poblacin. Por ejemplo, si X es la edad de los alumnos de este curso, no se sabe qu
distribucin tiene X pero podra suponerse que las edades siguen una distribucin normal. Siendo los
parmetros : edad promedio y o
2
: varianza de las edades, ambos desconocidos, la distribucin
normal no se encuentra especificada.
MUESTRA ALEATORIA:
Intuitivamente, una muestra aleatoria es un subconjunto de la poblacin seleccionado con algn
mtodo de muestreo probabilstico.
Formalmente, una muestra aleatoria de tamao n, extrada de una poblacin X con funcin de
densidad f(x), es un conjunto de n variables aleatorias X1, X2, , Xn independientes e
idnticamente distribuidas, todas con la misma distribucin de X.
ESTADSTICA:
Una estadstica T=t(X
1
, X
2
, , X
n
) es una funcin real de la muestra aleatoria, que no contiene
parmetros desconocidos.
Ejemplos de estadsticas: la media muestral, la varianza muestral, la proporcin muestral.
DISTRIBUCIN MUESTRAL:
Se denomina distribucin muestral a la distribucin de probabilidad de una estadstica, obtenida a
partir de todas las posibles muestras de tamao n, elegidas aleatoriamente de una poblacin
determinada.
La distribucin muestral de una estadstica desempea un papel fundamental en la teora de la
inferencia estadstica.
UNMSM FISI EAPIS - CURSO: ESTADSTICA II SEMESTRE ACADMICO 2013-2
PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 3
ESTIMADOR
Sea la muestra aleatoria X
1
, X
2
,..., Xn. Un estimador es una estadstica que se usa para estimar un
parmetro. Un estimador se denota como u
= T = t(X
1
, X
2
,..., Xn).
Ejemplo de estimador: u
= X =
=
n
i
i
n
x
1
, la media muestral.
ESTIMACIN ESTADSTICA
Es un procedimiento que consiste en utilizar datos muestrales para determinar los valores de los
parmetros desconocidos de una poblacin. La estimacin de un parmetro puede hacerse mediante
un nico valor (estimacin puntual) o mediante un conjunto de valores (estimacin por intervalo).
MUESTRA ALEATORIA
Una muestra aleatoria de tamao n, de una poblacin X, es un conjunto de n unidades
estadsticas, todas ellas elegidas con igual probabilidad y de manera independiente. De manera
equivalente, todas las muestras de tamao n tienen la misma probabilidad de ser seleccionadas.
OBSERVACIONES:
1) La definicin anterior equivale a decir que, una muestra aleatoria de tamao n, de X, es un
conjunto de n variables aleatorias X
1
, X
2
, ..., X
n
independientes e idnticamente distribuidas,
todas con la misma distribucin que X.
La variable X
i
denota el valor numrico del i-simo elemento muestreado.
2) Si en la poblacin, la media y la varianza de X son y o
2
, respectivamente, entonces cada
una de las variables X
i
de la muestra tendr la misma media y la misma varianza o
2
.
A los parmetros y o
2
se les llama media poblacional y varianza poblacional,
respectivamente. Recordar que, en una poblacin:
N
X X X
N
+ + +
=
...
2 1
y
2
1
2
) (
1
o =
=
N
i
i
X
N
MUESTREO PROBABILSTICO: SELECCIN DE LA MUESTRA
Obtener una muestra significa que en ella se vean reflejadas todas las caractersticas de la poblacin
en estudio. Las principales ventajas de estudiar una poblacin a partir de una muestra son las
siguientes: costo reducido, mayor rapidez, ms exactitud.
Unidad de muestreo: son colecciones no traslapadas de los elementos de la poblacin que cubren la
poblacin completa.
Marco muestral: Es una lista de unidades de muestreo.
MTODOS PROBABILISTICOS DE MUESTREO
UNMSM FISI EAPIS - CURSO: ESTADSTICA II SEMESTRE ACADMICO 2013-2
PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 4
MUETREO ALEATORIO SIMPLE (M.A.S.):
Un Muestreo Aleatorio Simple es aqul que se formula de modo que todos los elementos de una
poblacin de tamao N tengan la misma probabilidad de ser incluidos en la muestra de tamao n.
En este tipo de muestreo cada muestra de tamao n tiene la misma probabilidad de ser elegida.
El M.A.S puede ser de dos formas: sin reposicin y con reposicin.
El M.A.S generalmente es usado en encuestas de pequea escala.
En encuestas de gran escala, el M.A.S es utilizado como parte del diseo de muestreo que es ms
complejo.
Este tipo de muestreo probabilstico se aplica cuando la poblacin es homognea.
A cada unidad de muestreo se le asigna un nmero y a travs de un medio ( esferas dentro de una
urna, tabla de nmeros aleatorios, nmeros aleatorios generados por una calculadora o software
informtica) se eligen tantos elementos como sean necesarios para completar el tamao de la
muestra
MUESTREO SISTEMTICO
Se tiene un marco muestral; es decir, una lista con todas las N unidades de muestreo definidas en la
poblacin (algunas veces ser una lista de N unidades de anlisis). Para extraer la muestra
sistemtica de tamao n, se elige un nmero i al azar entre 1 y k , donde k = N/n y los elementos que
integran la muestra son los que ocupan las posiciones i, i+k, i+2k, i+3k, , i+(n-1)k; vale decir, que
se seleccionan los elementos de k en k
Por ejemplo, si el marco muestral est conformado por 100 unidades de muestreo y se desea una
muestra de tamao 20, entonces se elige al azar un nmero entre 1 y N/n = 5. Supongamos que sale
el 4, entonces las unidades que conforman la muestra seran las numeradas con 4, 9, 14, 19, 24, etc.,
hasta completar la muestra.
MUESTREO ESTRATIFICADO
Una muestra estratificada es obtenida mediante la separacin de la unidades de muestreo en grupos
llamados Estratos
Luego se seleccionan muestras aleatorias de cada estrato, mediante una muestreo aleatorio simple o
un muestreo aleatorio sistemtico.
El tamao de muestra de cada estrato se determina por el mtodo de afijacin proporcional.
Seleccin de una muestra estratificada:
i) Dividir la poblacin en k estratos.
Cada estrato consta de Ni unidades muestrales por lo tanto la poblacin tendr
N=N1+N2+..+Nk unidades muestrales
ii) Se selecciona una muestra independiente de cada estrato, utilizando cualquier esquema de
muestreo probabilstico.
El tamao de muestra de cada estrato est dado por:
Donde n es el tamao de la muestra total y n
i
el tamao de muestra de cada estrato.
CARACTERSTICAS DE LOS ESTRATOS:
Las mediciones dentro de los estratos deben ser homogneas (Baja variabilidad)
Las mediciones entre estratos deben ser heterogneas (alta variabilidad)
MUESTREO POR CONGLOMERADOS
En las encuestas por muestreo a gran escala, las unidades de muestreo suelen ser un grupo de
elementos que comnmente es denominado CONGLOMERADO de elementos. Los
conglomerados son subconjuntos muy similares entre s y al interior de cada uno hay mucha
disparidad. El muestreo de estas unidades es llamado Muestreo por Conglomerados.
|
.
|
\
|
=
N
N
n n
i
i
UNMSM FISI EAPIS - CURSO: ESTADSTICA II SEMESTRE ACADMICO 2013-2
PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 5
En este caso lo que se busca es una mayor diferencia de medidas dentro del conglomerado y
menor diferencia entre conglomerados. Para obtener la muestra por este mtodo se selecciona
cierto nmero de conglomerados hasta lograr el tamao de la muestra.
MUESTREO ESTRATIFICADO MUESTREO POR CONGLOMERADO
DISTRIBUCIONES MUESTRALES
A partir de una muestra aleatoria X
1
, X
2
, ..., X
n
se pueden formar otras variables aleatorias,
algunas de las cuales juegan un rol muy importante en la inferencia estadstica. Las principales
variables aleatorias que se pueden obtener a partir de una muestra aleatoria son la media muestral,
=
=
n
i
i
X X
1
n
1
; la varianza muestral,
2
1
2
) (
1
1
X X
n
S
n
i
i
=
=
y la proporcin muestral; estas
variables son comnmente conocidas como estadsticas muestrales.
A las distribuciones de probabilidad de cada una de estas estadsticas muestrales se les llama
distribuciones muestrales. As tenemos por ejemplo, la distribucin muestral de la media
muestral X .
Ejemplo: Con el siguiente ejemplo hipottico construiremos la distribucin muestral de la media
muestral X . Consideremos la siguiente poblacin de 5 ingresos anuales, en soles, de un grupo de
trabajadores de una empresa: {20, 40, 60, 80, 100}. La media poblacional de los puntajes es
5
...
5 2 1
X X X + + +
= = 60 y la varianza poblacional es
2
5
1
2
) (
5
1
o =
= i
i
X = 800.
Si de esta poblacin se extraen muestras aleatorias de tamao 2, el nmero total de posibles muestras
es 25, las cuales se detallan a continuacin:
(20,20) (40,20) (60,20) (80,20) (100,20)
(20,40) (40,40) (60,40) (80,40) (100,40)
(20,60) (40,60) (60,60) (80,60) (100,60)
(20,80) (40,80) (60,80) (80,80) (100,80)
(20,100) (40, 100) (60,100) (80, 100) (100,100)
Todas estas muestras son igualmente probables, con probabilidad igual a 1/25.
En cada muestra se calcula la media muestral X . Estas medias son, respectivamente:
POBLACIN
ESTRATOS
MUESTRA
POBLACIN
conglomerados
MUESTRA
UNMSM FISI EAPIS - CURSO: ESTADSTICA II SEMESTRE ACADMICO 2013-2
PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 6
20 30 40 50 60
30 40 50 60 70
40 50 60 70 80
50 60 70 80 90
60 70 80 90 100
Ahora, tomando en cuenta estos 25 valores de medias muestrales, construyamos la distribucin de
frecuencias relativas o, lo que es lo mismo, la distribucin de probabilidad:
x : 20 30 40 50 60 70 80 90 100
p( x ): 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25
Esta distribucin de probabilidad constituye la distribucin muestral de la media muestral, de este
ejemplo hipottico.
Si a partir de esta distribucin de medias calculamos la esperanza y la varianza, los valores de estos
parmetros son, respectivamente,
X
= ) (x p x
= 60 y ) ( ) (
2 2
x p x
x x
o =
= 400.
La media muestral es la estadstica muestral ms importante y es utilizada con mucha
frecuencia en problemas de toma de decisiones para medias poblacionales desconocidas.
DISTRIBUCIN MUESTRAL DE LA MEDIA MUESTRAL X
CUANDO EL MUESTREO
SE HACE DESDE CUALQUIER POBLACIN
Es la distribucin de probabilidad de la media muestral obtenida a partir de todas las posibles
muestras de tamao n extradas de una poblacin.
Siendo X una funcin de variables aleatorias independientes e idnticamente distribuidas, tambin
es una variable aleatoria. El valor esperado y la varianza de X son, respectivamente, E( X ) = y
Var( X ) =
o
2
n
.
Este resultado es vlido cualquiera que sea la distribucin de probabilidad de donde se obtuvo la
muestra.
En el ejemplo arriba citado, utilizando la distribucin de la media muestral se obtiene: E( X )= 60 =
y Var( X ) = 400 =
o
2
n
, cumplindose lo afirmado.
EL TEOREMA DEL LIMITE CENTRAL
Este teorema informa acerca de la distribucin muestral de medias, de muestras de tamao n.
Recurdese que bsicamente existen tres tipos de informacin que se desea conocer sobre una
distribucin: (1) dnde est el centro, (2) qu tanto vara, y (3) cmo est repartida. El Teorema del
Lmite Central proporciona informacin sobre estos tres aspectos.
Teorema del Lmite Central
Si se toman todas las posibles muestras de tamao n , de una poblacin con media y varianza o
2
,
entonces la distribucin muestral de las medias
UNMSM FISI EAPIS - CURSO: ESTADSTICA II SEMESTRE ACADMICO 2013-2
PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 7
1. tendr una media,
x
, igual a ,
2. tendr una varianza, o
x
2
, igual a
o
2
n
,
3. ser de tipo aproximadamente normal, an cuando la distribucin de donde proceden las
muestras no sea normal. La aproximacin mejora cuando aumenta el tamao de la muestra (n >30) .
Podemos resumir la importancia de este teorema del modo siguiente: cualquiera que sea la
distribucin de la poblacin de donde provienen las muestras (no necesariamente normal), la
media muestral tendr una distribucin que se comporta como una normal, siempre que el
tamao de la muestra sea grande.
Si la muestra proviene de una poblacin normal, la media muestral tendr distribucin
normal, an cuando la muestra no sea grande.
De acuerdo con este teorema, si X ~ N (,
o
2
n
) entonces la v.a. Z =
x
n
o
~ N (0,1).
Notar que, la desviacin estndar de la media muestral es igual a
n
o
, y es una medida de la
dispersin de la misma; vemos que la dispersin decrece conforme n crece.
A la desviacin estndar de la media muestral se le conoce tambin como error estndar de la
media.
APLICACIONES DEL TLC
Puesto que las medias estn distribuidas de manera aproximadamente normal, puede utilizarse la
tabla normal para el clculo de probabilidades.
Ejemplo 1
Sea una poblacin normal con = 100 yo
2
= 400. si se selecciona aleatoriamente una muestra de
tamao 16, cul es la probabilidad de que la media muestral vare entre 90 y 110? Es decir, cunto
vale P (90< X <110)?
Solucin:
Segn el TLC, X ~ N (
x
, o
x
2
). Pero
x
= y o
x
=
o
n
, entonces
X ~ N (,
o
2
n
) = N( , / ) 100 400 16 . Estandarizando: Z =
x
n
o
~ N (0,1). Luego P (90< X <110) =
P (
90 100
20 16
<
x
n
o
<
110 100
20 16