Professional Documents
Culture Documents
INTRODUCCIÓN AL MUESTREO
Una investigación estadística de campo, atendiendo
a su cobertura, únicamente puede hacerse de 2
formas:
Por su frecuencia:
Transversal
Longitudinal
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
AÑO 2010
Clasificación de las encuestas
Por su frecuencia:
1. Transversal 2.1.1. Continuos
2.2.1. Continuos
2.2.2. Por intervalos de tiempo
TIPOS DE MUESTREO
NÚMEROS
1 1/6
2 1/6
3 1/6
En el muestreo probabilístico, cada
4 1/6
elemento de la población tiene una
5 1/6 probabilidad conocida y no nula de
6 1/6 ser seleccionado.
MUESTREO NO PROBABILÍSTICO
O MUESTREO DE MODELOS
El muestreo no probabilístico incluye todos los métodos en que
las unidades NO se seleccionan por procedimientos al azar o con
probabilidades conocidas de selección.
Muestra de Limitante:
viviendas No es posible
estimar
Importancia del Muestreo Probabilístico
LA MUESTRA
n
MUESTRA
Una buena muestra debe reunir tres
características esenciales:
Población
La población se define conjuntamente con los
elementos: la población es el agregado de los
elementos, y los elementos son las unidades básicas
que forman y definen la población. Esta debe definirse
en términos de: a) el contenido; b) las unidades; c) la
extensión, y d) el tiempo.
La investigación por medio de encuestas tiene por
objeto estimar valores específicos de la población:
Valor de la población:
Es una expresión numérica que sintetiza los valores de
una o varias características de los N elementos de una
población completa; es una medida resumida de la
cualidad de la distribución de la variable o variables en
la población definida.
Valor verdadero
El valor verdadero es aquel que se obtendría de todos
los elementos de la población, si las observaciones no
estuvieran sujetas a error.
Valor de la muestra o estadística
Es una estimación que se calcula a partir de los n
elementos de una muestra.
En una encuesta probabilística se manifiestan dos tipos de errores:
Error muestral
Los errores de muestreo son aquellos que ocurren porque
solamente se designa una parte de la población total para que sea
observada en la muestra.
Errores no muestrales
Se presentan porque los procedimientos de observación son
imperfectos.
Unidad de análisis o
unidad de observación
Es aquella para la cual se desea obtener información estadística.
Se define como: el objeto, institución, región, persona, familia,
animal etc. que va a ser sometido al estudio, en cuanto a aquellas
características que más interesan.
Unidad de muestreo
Son las unidades que se utilizan para constituir o seleccionar la
muestra (unidad de selección).
Unidad de información
La unidad de información es aquella que provee información de las
unidades de análisis.
MARCO MUESTRAL
Es un conjunto finito de unidades (personas, viviendas,
instituciones, etc.), denominadas unidades de muestreo,
sobre las cuales se desea aplicar el proceso de
selección.
Se pueden distinguir dos tipos de marcos:
Total de
Proporción (P̂ )
clase ( τ̂)
Cualitativa
La inferencia estadística se basa en los errores
estándar, y ésta toma típicamente la forma:
θ ± t p s ( y )
Esto denota el enunciado de que el valor poblacional
está dentro del intervalo:
n
MUESTREO ALEATORIO SIMPLE
O MUESTREO IRRESTRICTO ALEATORIO
Población de N unidades elementales
1 2 3 15 29 31 32 49 56 57
14 30
33 48
4 6 13 16 28 55
17 35 59
7 34 51
5 12 18 46 58
22 26 36 42 53
10 52 60
8 37 43 62
23 25
9 11 20 21 24 38 39 40 44 47 54 63 61
41
45 27
50
n=5
Muestra “n” 19
Propiedades del muestreo irrestricto aleatorio (mia)
Con este supuesto, por ser equiprobables todas las muestras de n elementos, la
probabilidad de que un elemento poblacional dado forme parte de la muestra se
puede calcular así:
N − 1
#muestras _ favorables n − 1 n
= =
#muestras _ posibles
N N
n
En el mia, al seleccionar la primera una unidad elemental de una muestra, con los
N-1 restantes pueden hacerse (N-1 n-1) combinaciones que completan la
muestra de n.
Por consiguiente, todos los elementos tienen la misma probabilidad n/N de ser
extraídos (y 1/N de serlo en determinado lugar). Recíprocamente, si el supuesto
es que todos los elementos son equiprobables, la probabilidad de una muestra
constituida por n elementos dados es:
1 1 1 1
∗ n! =
N N −1 N − n +1 N
…
n
Continuando con el ejemplo anterior, para una muestra de n=3 de una población
N=6, se observa lo siguiente en un muestreo irrestricto aleatorio:
1 1 1 1 1 1
* * 3! = = 6= = 0.05 = 0.05
6 5 4 N 120 20
n
Ejemplo: una población de N=6 elementos tiene los valores Yi ={0, 1, 3, 5, 6, 9}
El total de la población es Y=24 y la media de
la población es Y/N = 24/6 = 4. La ΣYi2 = 152, y 0 1 2 3 4 5 6 7 8 9
y´− YV
Estimadores en el muestreo
irrestricto aleatorio:
Los estimadores son funciones matemáticas de la
información proporcionada por las unidades
elementales de una muestra. En general, interesa la
estimación alguno de los siguientes parámetros o
características de la población:
Total de
Proporción (P̂ )
clase ( τ̂)
Cualitativa
Estimadores en un muestreo irrestricto aleatorio
Estimador de la media
Por definición, la media aritmética
poblacional se obtiene de:
y1 + y 2 + y 3 + ... + y N 1 N
Y= = ∑ yj
N N j=1
y1 + y 2 + y 3 + ... + y n 1 n
Ŷ = = ∑ yj
n n j=1
Estimadores en un muestreo irrestricto aleatorio
Varianza y error estándar del estimador de la media
La varianza verdadera de una población está dada por:
N N N
∑ (y j − Y) 2
∑y 2
j − NY 2
Simplificada
∑ j
(y
j=1
− Y) 2
S =
2 j =1
= j =1
(cuasi-varianza) S2 =
v
N N N −1
La varianza de la media en un mia se obtiene de:
S2
var(y) = (1 − f)
n
En donde:
n
n∑ y 2j − y 2
1 n 1 n 2 y2
∑ ∑ y j − =
j=1
S = 2
(y j − y) =
2
N n
Ŷ = Ny O bien, Ŷ = ∑ y j
n j=1
Varianza y error estándar del estimador de un total
n
2 n∑ y 2j − y 2
ˆ = (1 − f) S 1 n
1 n
y 2
ˆ = ∑ ∑ j
j=1
var(Y) donde: var(Y) (y j − y) 2
= y 2
− =
n n − 1 j=1 n − 1 j=1 n n(n − 1)
ˆ s
s(Y) = N var(y) = N 1 − f
n
Estimadores en un muestreo irrestricto aleatorio
Estimador de una proporción (características cualitativas o atributos)
Por definición, en una población constituida por a1, a2,…aN elementos que poseen
una característica cualitativa o atributo, definimos la proporción como el cociente de
la suma de los N valores de ai por el número de elementos de la población N.
N
∑a i
A y la antiproporción Q =1−P
P= i=1
=
N N
Por lo tanto, un estimador simple de P en el mia está dado por el cociente:
n
∑ ai a y el total de la clase
N n N
 = ∑ ai = a = Np
P̂ = i=1
= n i=1 n
n n
Varianza y error estándar del estimador de una proporción
ˆ = (1 − f) p(1 − p)
var(P) ˆ = var(p) + 1 = (1 − f) p(1 − p) + 1
s(P)
n −1 2n n −1 2n
Nota técnica: La distribución de p de una muestra irrestricta aleatoria se llama
distribución hipergeométrica debido a su selección sin reemplazamiento.
Estimadores en un muestreo irrestricto aleatorio
Estimador de razón
Por definición, la razón es aquella que mide la relación entre dos variables,
permitiendo su comparación, calculado generalmente por cociente.
N
1 N
∑
j=1
yi ∑
N j=1
yi
Y
R= N = N
=
1 X
∑
j=1
x i
N
∑
j=1
x i
n
1 n
∑
j=1
yi ∑
n j=1
yi
y
R̂ = n = n
=
1 x
∑
j=1
xi ∑
n j=1
xi
Varianza y error estándar del estimador de una razón
n n n n
1−f
∑ (y j − Rx
ˆ j) 2
1−f
∑ y − 2Rˆ ∑ y j x j + Rˆ
2
j
2
∑ j
x 2
ˆ
var(R) = ⋅ j=1
= ⋅ j=1 j=1 j=1
nx 2
n −1 nx 2
n −1
n n n n
1−f
∑ (y j − Rx
ˆ j) 2
1−f
∑ y − 2Rˆ ∑ y j x j + Rˆ
2
j
2
∑ j
x 2
ˆ
s(R) = ⋅ j=1
= ⋅ j=1 j =1 j=1
nx n −1 nx n −1
MUESTREO ALEATORIO SISTEMÁTICO
O MUESTREO SEUDOALEATORIO
(supuesto aleatorio)
Método de muestreo que denota la selección de las unidades de
una muestra, de k en k (unidad de muestreo k-ésima), a partir de
uno de ellos elegido aleatoriamente entre los que ocupan el lugar
primero y el i-ésimo lugar en una población objeto de estudio.
n
MUESTREO ALEATORIO SISTEMÁTICO
O MUESTREO SEUDOALEATORIO
Universo “N”
2 3 4 5 6 7 8 9 10 12 13 14 15
16 17 18 19 20 22 23 24 25 26 27 28 29 30
32 33 34 35 36 37 38 39 40 42 43 44 45
46 47 48 49 50 52 53 54 55 56 57 58 59 60
Datos:
Paso 1: Selección aleatoria
N = 60
Ran# = 0.683
n=6
0.683 x 60 = 40.98 = 41
Selección aleatoria = 41
Paso 2: Intervalo K
K = 10 51 11
1 K= N/n
K = 60 / 6 = 10
Muestra 21
41 NOTA: Cuando el origen no es aleatorio (paso 1
31 selección aleatoria), el muestreo puede denominarse
rígida o estrictamente sistemático y deja de ser
probabilístico.
MUESTREO ESTRATIFICADO
Estratificación: proceso mediante el cual se agrupan los elementos de
una población conforme a determinadas características comunes.
N1 N3
N2
Afijación
Se denomina afijación, al modo
de distribuir las unidades de una
muestra entre los diferentes
estratos.
n
MUESTREO ESTRATIFICADO ALEATORIO
Si se parte de una población de N unidades elementales, que se encuentra
dividida en L subpoblaciones (estratos o subclases) de N1, N2 ….NL unidades
elementales cada uno, y posteriormente seleccionamos una muestra irrestricta
aleatoria independiente en cada estrato, entonces el procedimiento se
denomina muestreo estratificado aleatorio.
np np
np np
n1 n2 n3 n4
nT
MUESTREO POR CONGLOMERADOS O ÁREAS
Unidad de análisis:
Población de viviendas
del departamento de
Huehuetenango. N = conglomerados (que
formarán las unidades de
muestreo)
Conjunto de elementos
n = muestra de 2
conglomerados
de elementos.
CONGLOMERADOS O
POBLACIÓN OBJETIVO VARIABLES ELEMENTOS UNIDADES DE
MUETREO
Características de la
Ciudad A vivienda Viviendas Manzanas
MUESTREO DE RECOMENDACIÓN
Muestreo medido
de poblaciones
(2da. y
= medido móviles
ocasión)
marcado=
Métodos
Métodos de
de captura-marca-recaptura
captura-marca-recaptura
Tamaño de la muestra
POBLACIÓN 1 POBLACIÓN 2 POBLACIÓN 3
Muestra 1
Muestra 2
Muestra 3
TAMAÑO ADECUADO DE LA MUESTRA
BAJO
b. Nivel de confianza deseado en el estimado: Cuando
más alto sea el nivel de confianza que se desee, mayor
será el tamaño de la muestra necesario.
Confianza: grado de certeza de que la estimación obtenida con la
muestra contenga al valor verdadero del parámetro. Por ejemplo, si
se dice que el nivel de confianza es de 95%, esto significa que el
valor del parámetro poblacional se encontrará dentro del
intervalo especificado en 95 de cada 100 muestras posibles.
θ
c. Grado de precisión deseado en la estimación de la
característica de la población: Cuanto más precisos
sean los resultados de la muestra que se requieren (esto
es, cuando menor sea el error), mayor será el tamaño de
muestra necesario.
GRACIAS POR SU
ATENCIÓN