You are on page 1of 72

Introducción al Muestreo

INTRODUCCIÓN AL MUESTREO
Una investigación estadística de campo, atendiendo
a su cobertura, únicamente puede hacerse de 2
formas:

a. Investigando todos y cada uno de los elementos de


la población. CENSO

b. Investigando cada uno de los elementos de una parte


o porción de la población, denominada muestra.
ENCUESTA
ENCUESTA
De manera general, una encuesta comprende la
metodología, los trabajos efectuados y los
instrumentos utilizados para elaborar una inferencia
acerca de las características de la población bajo
estudio, y toma como base la información obtenida
por la observación de una muestra.

El objetivo de las encuestas es evaluar variables que


caracterizan un agregado de la población, a través
de la observación de un subconjunto llamado
“muestra”.
Clasificación de las encuestas

Por su frecuencia:

Transversal

Longitudinal

ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC

AÑO 2010
Clasificación de las encuestas

Por su frecuencia:
1. Transversal 2.1.1. Continuos

2. Longitudinal 2.1.2. Por intervalos de tiempo


2.1. Paneles Fijos
2.2. Paneles Rotativos

2.2.1. Continuos
2.2.2. Por intervalos de tiempo

Un panel: es una muestra en la que se miden los mismos


elementos en dos o más ocasiones.
VENTAJAS DE LA ENCUESTRA
a. Su realización es menos costosa en comparación con el
censo.
b. Mayor rapidez y oportunidad en la recopilación y análisis
de datos.
c. Capacitación más intensiva y supervisión más cuidadosa
para el personal de la encuesta debido al número de
personal involucrado en la encuesta.
d. Permite flexibilidad en los temas cubiertos por la
encuesta.
e. Mejor calificación y mayor capacidad del personal de
campo de una encuesta.
f. Es menos notoria que el censo y no constituye un fardo
tan pesado para la buena voluntad del público.
g. Capacidad de aplicar análisis estadísticos avanzados.
h. Es el único procedimiento utilizado para medir fenómenos
cambiantes en el corto plazo debido a su costo
relativamente bajo.
DESVENTAJAS DE LA ENCUESTRA

• No cubre la población total.


• Los resultados son cien porciento confiables a nivel
muestral.
• Dificultad para evitar el rechazo y la no respuesta.
• La aceptación pública es más difícil de alcanzar para
datos completos.
• Dificultad de determinar si los entrevistados responden
honestamente.
• Acepta un grado de error en la estimación.
• Necesita recurrir a un proceso inferencial para generar
resultados validos a la población total (ya que supone
de un instrumento delicado y complejo).
MUESTREO
El muestreo consiste en la selección de un
número relativamente pequeño de elementos
tomado de un grupo de elementos definido
mayor, con la expectativa de que la información
recogida del grupo menor permita que se hagan
inferencias sobre el grupo mayor.

TIPOS DE MUESTREO

a. Probabilístico o científico. b. No probabilístico.


MUESTREO PROBABILÍSTICO

Es el tipo de muestreo que se basa en la Ciencia Matemática y


Estadística (cálculo de probabilidades).

Existen numerosas variaciones en el muestreo probabilístico,


pero todas comparten un rasgo común: la selección de las
unidades para la muestra se realiza por procedimientos aleatorios
y con probabilidades conocidas de selección.

Las muestras probabilísticas se diseñan generalmente para que


sean medibles, es decir, se diseñan de tal manera que la
inferencia estadística a valores de la población pueda basarse en
medidas de variabilidad, generalmente errores estándar,
calculados a partir de datos de una muestra.
PROCEDIMIENTOS ALEATORIOS (AZAR) Y
PROBABILIDADES CONOCIDAS DE SELECCIÓN

NÚMEROS
1 1/6
2 1/6
3 1/6
En el muestreo probabilístico, cada
4 1/6
elemento de la población tiene una
5 1/6 probabilidad conocida y no nula de
6 1/6 ser seleccionado.
MUESTREO NO PROBABILÍSTICO
O MUESTREO DE MODELOS
El muestreo no probabilístico incluye todos los métodos en que
las unidades NO se seleccionan por procedimientos al azar o con
probabilidades conocidas de selección.

Se le llama también muestreo de modelos, porque se basa en


suposiciones muy amplias acerca de la distribución de las
variables de una muestra de la población.
Población de viviendas

Muestra de Limitante:
viviendas No es posible
estimar
Importancia del Muestreo Probabilístico

El muestreo probabilístico es importante por tres razones:

1. Su medibilidad lleva a inferencias estadísticas


objetivas, en contraste con las inferencias
subjetivas que se obtienen en el muestreo no
probabilístico.
2. Como sucede con cualquier método científico, éste
permite mejoramientos acumulativos a través de la
separación y la evaluación objetiva de sus fuentes
de errores.
3. Cuando los métodos simples fallan, los
investigadores acuden al muestreo probabilístico.
La base de una buena encuesta por muestreo es
la muestra.

LA MUESTRA

Subconjunto o parte constituida de “n” elementos,


tomados o seleccionados de una población de “N”
elementos, la cual reúne ciertas características
que la hacen ser representativa, significativa y
confiable, y que en base a ella se pueden hacer
inferencias válidas respecto a la población total de
la cual procede.
POBLACIÓN

n
MUESTRA
Una buena muestra debe reunir tres
características esenciales:

a. Representativa: en el sentido de que cada unidad


muestreada representará las características de una
cantidad conocida de unidades de la población.

b. Significativa: en relación a la precisión de las


estimaciones (error muestral considerado).

c. Confiable: al considerar un valor de “Z” en la


distribución normal, lo cual indica el nivel de
confiabilidad aceptado para la muestra.
Conceptos Básicos
Elementos de una población
Los elementos de una población son las unidades de
las que se busca la información; son los individuos, las
unidades elementales que forman la población acerca
de la cual se van a hacer inferencias. Son las unidades
de análisis, y su naturaleza se determina mediante los
objetivos de la encuesta.

Población
La población se define conjuntamente con los
elementos: la población es el agregado de los
elementos, y los elementos son las unidades básicas
que forman y definen la población. Esta debe definirse
en términos de: a) el contenido; b) las unidades; c) la
extensión, y d) el tiempo.
La investigación por medio de encuestas tiene por
objeto estimar valores específicos de la población:
Valor de la población:
Es una expresión numérica que sintetiza los valores de
una o varias características de los N elementos de una
población completa; es una medida resumida de la
cualidad de la distribución de la variable o variables en
la población definida.
Valor verdadero
El valor verdadero es aquel que se obtendría de todos
los elementos de la población, si las observaciones no
estuvieran sujetas a error.
Valor de la muestra o estadística
Es una estimación que se calcula a partir de los n
elementos de una muestra.
En una encuesta probabilística se manifiestan dos tipos de errores:

Error muestral
Los errores de muestreo son aquellos que ocurren porque
solamente se designa una parte de la población total para que sea
observada en la muestra.

Errores no muestrales
Se presentan porque los procedimientos de observación son
imperfectos.

Ejemplo: equivocaciones y deficiencias durante el desarrollo y


ejecución de los procedimientos de la encuesta, definiciones
concebidas erróneamente, imperfecciones en los planes de
tabulación, preguntas mal formuladas, errores en el procesamiento
de los datos, deficiencias en el marco de muestreo y la no
respuesta.
En el muestreo probabilístico se distinguen tres tipos de unidades:

Unidad de análisis o
unidad de observación
Es aquella para la cual se desea obtener información estadística.
Se define como: el objeto, institución, región, persona, familia,
animal etc. que va a ser sometido al estudio, en cuanto a aquellas
características que más interesan.

Unidad de muestreo
Son las unidades que se utilizan para constituir o seleccionar la
muestra (unidad de selección).

Unidad de información
La unidad de información es aquella que provee información de las
unidades de análisis.
MARCO MUESTRAL
Es un conjunto finito de unidades (personas, viviendas,
instituciones, etc.), denominadas unidades de muestreo,
sobre las cuales se desea aplicar el proceso de
selección.
Se pueden distinguir dos tipos de marcos:

1. Marco en forma de listado (elementos):

En el cual cada unidad de marco esta asociada con un


único elemento de la población objetivo. Un muestreo
de elementos puede ser obtenido directamente a partir
del marco. Un listado de empleados de una compañía,
un listado de clientes de una tarjeta de crédito, un
listado de las cuentas corrientes de un banco, son
algunos ejemplos de este tipo de marco.
2. Marco de grupos (conjuntos de elementos):

En el cual cada unidad del marco esta asociada con varios


elementos de la población objetivo. En este caso el muestreo no es
tan directo, ya que primero se seleccionan algunos grupos y luego
se observan todos o algunos de los elementos pertenecientes a los
grupos seleccionados.

Un caso especial y muy importante de marcos de grupos es el


marco de áreas, que se emplea principalmente para seleccionar
viviendas, aunque también puede usarse para seleccionar locales
comerciales (farmacias, heladerías, venta de electrodomésticos,
etc.), escuelas, centros asistenciales, etc. Como su nombre lo
indica, el marco de áreas esta formado por unidades territoriales
delimitadas geográficamente.
ESTIMADOR
Es una fórmula algebraica que permite agregar o
combinar las respuestas o mediciones hechas sobre
una variable o atributo en las unidades seleccionadas.
Formalmente y en general en una muestra de tamaño
“n” el estimador relaciona a los “n” valores de la
variable en cuestión y lo que se busca con él es que
brinde una aproximación al parámetro.

El estimador se clasifica en puntual cuando hace


referencia a un solo valor o punto calculado, y por
intervalos cuando corresponde a dos puntos dentro de
los cuales se considera estará contenido el parámetro,
con cierto grado de confiabilidad establecido por el
investigador.
Parámetros estimados en
muestreos probabilísticos

En general, interesa la estimación de alguno de los


siguientes parámetros o características de la
población:

Variable Parámetro a estimar ( θ)


Cuantitativa Total ( τ̂) Media ( Y
ˆ) Razón ( R̂ )

Total de
Proporción (P̂ )
clase ( τ̂)
Cualitativa
La inferencia estadística se basa en los errores
estándar, y ésta toma típicamente la forma:

θ ± t p s ( y ) 
Esto denota el enunciado de que el valor poblacional
está dentro del intervalo:

θ − t p s(y)  a θ + t p s(y) 


Y la probabilidad P de este enunciado es función (en
general aproximadamente normal) de la constante
escogida tp (desvío t).
Diseño de encuestas y diseño de muestras
MUESTREO DE ENCUESTAS
O MUESTREO DE POBLACIÓN

Estudia los métodos para seleccionar y


observar una parte (muestra) de la
población con el fin de hacer inferencias
acerca de toda la población.

El muestreo de encuestas se concentra en


el estudio de muestras probabilísticas
para estimar valores de la población.
Diseño de encuestas y
diseño de muestras
El diseño de muestras tiene dos aspectos:

Un proceso de selección: que consiste en las reglas y


operaciones mediante las cuales se incluyen en la muestra
algunos miembros de la población.

Un proceso de estimación: para calcular las estadísticas de la


muestra, que son estimaciones muestrales de valores de la
población. Frecuentemente interesa la aplicación de alguna de
las siguientes medidas en la estimación: la media o promedio, el
total, la proporción (tasas) y la razón.

El diseño de encuestas incluye además otros aspectos


importantes que pueden llamarse conjuntamente
objetivos de la encuesta.
Objetivos de la encuesta:
La definición de las variables de la encuesta: debe especificar la
naturaleza de las características, las reglas de la categoría de
clasificación, y las unidades para expresarlas. Debe determinar
también el alcance y el contenido de la población de la encuesta.
Los métodos de observación (medición): que incluyen tanto la
recolección como el procesamiento de datos.
Los métodos de análisis: que incluyen tanto los estadísticos
como los sustanciales. Con ello se reduce la encuesta a
resultados que puedan comprenderse y utilizarse.
La utilización de los resultados de la encuesta: que en
ocasiones, puede tomar la forma de decisiones concretas
basadas en los resultados de la encuesta y de información
proveniente de otras fuentes.
La precisión: que se desea que tengan los resultados de la
encuesta, para llegar a una decisión estadística especificada.

Los objetivos de la encuesta deben


determinar el diseño de la muestra**
Criterios del diseño de
una muestra
El muestreo de encuestas se ocupa principalmente de
modificaciones al muestreo irrestricto aleatorio. Las que impliquen
una mayor complejidad deberán justificarse con vigorosas
consideraciones.

Un buen diseño de muestreo requiere que se equilibren


sensatamente cuatro amplios criterios:

1. Orientación hacia la meta: el diseño completo, tanto en la


selección como en la estimación, debe orientarse a los objetivos de
la investigación, hechos a la medidas del diseño de la encuesta y
ajustados a las condiciones de la encuesta.
Criterios del diseño de
una muestra
2. La medibilidad: es una característica de los diseños que permite
calcular, a partir de la propia muestra, estimaciones válidas o
aproximaciones a su variabilidad de muestreo (esto se suele
expresar en las encuestas con errores estándar).

La medibilidad es la base necesaria para la inferencia estadística, y


sirve como puente científico y objetivo, entre el resultado de la
muestra y el valor desconocido de la población.

La teoría de la inferencia estadística depende de muestreo


probabilísticos, es decir, muestreos en los que se conoce la
probabilidad de selección de cada elemento de la población.
Criterios del diseño de
una muestra

3. La practicidad: se refiere a los problemas que deben resolverse


para llevar a cabo el diseño esencialmente como se propuso.

Se requiere de cuidado para traducir el modelo de selección teórico


a un conjunto de instrucciones de oficina y campo. Estas
instrucciones deben ser simples, claras, prácticas y completas.

4. La economía: se refiere a cumplir los objetivos de la encuesta con


un costo (esfuerzo) mínimo y al grado (precisión) en que se alcanza
este objetivo.
Clases de Muestras
CLASES DE MUESTRAS
PROBABILÍSTICAS
1. Muestreo aleatorio simple.
2. Muestreo estratificado.
3. Muestreo estratificado aleatorio.
4. Muestreo aleatorio sistemático.
5. Muestreo por conglomerados o áreas.
6. Muestreo monotápico.
7. Muestreo bietápico.
8. Muestreo polietápico.
9. Muestreo simple.
10.Muestreo doble o bifásico.
11.Muestreo múltiple o polifásico.
12.Muestreo balanceado.
13.Métodos mixtos.
CLASES DE MUESTRAS
NO PROBABILÍSTICAS

1. Muestreo por conveniencia.


2. Muestreo por juicio.
3. Muestreo por cuotas.
4. Muestreo por bola de nieve.
5. Muestreo de poblaciones móviles.
MUESTREO ALEATORIO SIMPLE
MUESTREO IRRESTRICTO ALEATORIO
(Sin reemplazamiento )
Es la forma esencial del muestreo probabilístico. Es un método de
selección de muestras en la cual las unidades se eligen individual y
directamente por medio de un proceso aleatorio, cada unidad muestral
que forma parte de la población meta definida tiene una probabilidad
conocida, igual y diferente de cero de ser elegida.

n
MUESTREO ALEATORIO SIMPLE
O MUESTREO IRRESTRICTO ALEATORIO
Población de N unidades elementales
1 2 3 15 29 31 32 49 56 57
14 30
33 48
4 6 13 16 28 55
17 35 59
7 34 51
5 12 18 46 58
22 26 36 42 53
10 52 60
8 37 43 62
23 25
9 11 20 21 24 38 39 40 44 47 54 63 61

41
45 27
50
n=5
Muestra “n” 19
Propiedades del muestreo irrestricto aleatorio (mia)

El muestreo irrestricto aleatorio (mia) consiste en la selección de n unidades


elementales entre los N elementos que constituyen una población, de modo que
todas las muestras posibles de tamaño n (tantas como combinaciones de N
elementos de n en n) tengan la misma probabilidad 1/(N n) de ser obtenidas.

Con este supuesto, por ser equiprobables todas las muestras de n elementos, la
probabilidad de que un elemento poblacional dado forme parte de la muestra se
puede calcular así:
N − 1
 
#muestras _ favorables  n − 1  n
= =
#muestras _ posibles  
N N
 
n

Ejemplo: si se dispone de una población de tamaño N= {A, B, C, D, E, F} y


se obtiene una muestra irrestricta aleatoria de n = 3, entonces:
 6 − 1  5 
   
 3 − 1  =  2  = 10 = 0.5 = n = 3 = 0.5
6  6  20 N 6
   
3
  3
Propiedades del muestreo irrestricto aleatorio (mia)

En el mia, al seleccionar la primera una unidad elemental de una muestra, con los
N-1 restantes pueden hacerse (N-1 n-1) combinaciones que completan la
muestra de n.

Por consiguiente, todos los elementos tienen la misma probabilidad n/N de ser
extraídos (y 1/N de serlo en determinado lugar). Recíprocamente, si el supuesto
es que todos los elementos son equiprobables, la probabilidad de una muestra
constituida por n elementos dados es:

1 1 1  1
 ∗  n! =
N N −1 N − n +1 N

 
n
Continuando con el ejemplo anterior, para una muestra de n=3 de una población
N=6, se observa lo siguiente en un muestreo irrestricto aleatorio:

1 1 1  1  1  1
 * *  3! = =   6= = 0.05 = 0.05
6 5 4 N  120  20
 
n
Ejemplo: una población de N=6 elementos tiene los valores Yi ={0, 1, 3, 5, 6, 9}
El total de la población es Y=24 y la media de
la población es Y/N = 24/6 = 4. La ΣYi2 = 152, y 0 1 2 3 4 5 6 7 8 9

tenemos que la varianza por elemento es n y1 y2 y3 y y2 media s2 var (y) y - fY


Sy2=(ΣYi2-(Y2/N))/(N-1)=11.2 1 0 1 3 4 10 1.33 2.33 3.5 -8

Una muestra irrestricta aleatoria de n=3 2 0 1 5 6 26 2.00 7.00 10.5 -6

elementos resulta en f = n/N = 0.5. La 3 0 1 6 7 37 2.33 10.33 15.5 -5


distribución de muestreo contiene (N n) = 20 4 0 1 9 10 82 3.33 24.33 36.5 -2
muestras posibles en la columna 1, 2 y 3. cada 5 0 3 5 8 34 2.67 6.33 9.5 -4
uno de los elementos aparece f = 0.5 de las 6 0 3 6 9 45 3.00 9.00 13.5 -3
muestras.
7 0 3 9 12 90 4.00 21.00 31.5 0
Se puede ver que las estimaciones muestrales 8 0 5 6 11 61 3.67 10.33 15.5 -1
de y en la columna 4 varían. Su promedio o 9 0 5 9 14 106 4.67 20.33 30.5 2
valor esperado es de 12, los que nos señala
10 0 6 9 15 117 5.00 21.00 31.5 3
que E(y)=fY, que y es un estimador insesgado
11 1 3 5 9 35 3.00 4.00 6 -3
de fY. Entonces y/f es un estimador insesgado
de Y, y y/n lo es de la media poblacional. 12 1 3 6 10 46 3.33 6.33 9.5 -2
13 1 3 9 13 91 4.33 17.33 26 1
Nótese que en la columna 5 el valor esperado
14 1 5 6 12 62 4.00 7.00 10.5 0
de Σyi2=76, igual a fΣYi2 y por lo tanto es un
estimador insesgado. 15 1 5 9 15 107 5.00 16.00 24 3
16 1 6 9 16 118 5.33 16.33 24.5 4
Nótese que para una Var(y)=(1-n/N)nSy2 =16.8. 17 3 5 6 14 70 4.67 2.33 3.5 2
Las varianzas calculadas en la columna 8 18 3 5 9 17 115 5.67 9.33 14 5
varían grandemente, pero su esperanza es 19 3 6 9 18 126 6.00 9.00 13.5 6
16.8; por tanto, E[var (y)] = Var (y) y en las
20 5 6 9 20 142 6.67 4.33 6.5 8
desviaciones de (y-fY) en la distribución de la
Media 12 76 4.00 11.20 16.8 0
muestra también se ve que E[y-E(y)]=0 puesto
que y es un estimador insesgado.
DISTRIBUCIÓN DE MUESTREO
Probabilidad (Pc) de yc
La media de la distribución de
muestreo es el valor esperado (o la
esperanza matemática E(y)) del
estimador.
Una muestra
Especificada y´ Este valor medio E(y) puede ser igual al
valor de la población Y, o puede no
Pc serlo.

-3s(y) -2s(y) -1s(y) E(y) 1s(y) 2s(y) 3s(y)


2
y = s(y) = E  y − E ( y ) 
La distribución de muestreo de un
estimador (media) es la distribución
Error estándar de
teórica de todos los valores posibles del
estimador (yc), cada uno con una Y YV
probabilidad de materialización (PC).
Sesgo de muestreo = E(y) − Y
Los valores posibles y sus
probabilidades dependen del diseño de
muestreo (tamaño, selección y
Sesgo no de muestreo = Y − YV
estimación) aplicado a una población fija
de características. Error total de una muestra especifica

y´− YV
Estimadores en el muestreo
irrestricto aleatorio:
Los estimadores son funciones matemáticas de la
información proporcionada por las unidades
elementales de una muestra. En general, interesa la
estimación alguno de los siguientes parámetros o
características de la población:

Variable Parámetro a estimar ( θ)


Cuantitativa Total ( τ̂) Media ( Y
ˆ) Razón ( R̂ )

Total de
Proporción (P̂ )
clase ( τ̂)
Cualitativa
Estimadores en un muestreo irrestricto aleatorio

Estimador de la media
Por definición, la media aritmética
poblacional se obtiene de:

y1 + y 2 + y 3 + ... + y N 1 N
Y= = ∑ yj
N N j=1

Por lo que utilizaremos como


estimador de la media poblacional la
media muestral:

y1 + y 2 + y 3 + ... + y n 1 n
Ŷ = = ∑ yj
n n j=1
Estimadores en un muestreo irrestricto aleatorio
Varianza y error estándar del estimador de la media
La varianza verdadera de una población está dada por:
N N N

∑ (y j − Y) 2
∑y 2
j − NY 2
Simplificada
∑ j
(y
j=1
− Y) 2

S =
2 j =1
= j =1
(cuasi-varianza) S2 =
v
N N N −1
La varianza de la media en un mia se obtiene de:
S2
var(y) = (1 − f)
n
En donde:
n
n∑ y 2j − y 2
1 n 1  n 2 y2 
∑ ∑ y j −  =
j=1
S = 2
(y j − y) =
2

n − 1 j=1 n − 1  j=1 n n(n − 1)


El error estándar de la media muestral es la raíz cuadrada de su varianza:
s
s(y) = var(y) = 1 − f
n
Estimadores en un muestreo irrestricto aleatorio
Estimador del total
Por definición, el total poblacional se obtiene de:
N
Y = (y1 + y 2 + y 3 + ... + y N ) = ∑ y j O bien, Y = NY
j=1

Por lo tanto, un estimador simple de Y en un mia es el siguiente:

N n
Ŷ = Ny O bien, Ŷ = ∑ y j
n j=1
Varianza y error estándar del estimador de un total
n

2 n∑ y 2j − y 2
ˆ = (1 − f) S 1 n
1  n
y 2

ˆ = ∑ ∑ j
j=1
var(Y) donde: var(Y) (y j − y) 2
= y 2
− =
n n − 1 j=1 n − 1  j=1 n n(n − 1)

y su error estándar se estima mediante:

ˆ s
s(Y) = N var(y) = N 1 − f
n
Estimadores en un muestreo irrestricto aleatorio
Estimador de una proporción (características cualitativas o atributos)
Por definición, en una población constituida por a1, a2,…aN elementos que poseen
una característica cualitativa o atributo, definimos la proporción como el cociente de
la suma de los N valores de ai por el número de elementos de la población N.
N

∑a i
A y la antiproporción Q =1−P
P= i=1
=
N N
Por lo tanto, un estimador simple de P en el mia está dado por el cociente:
n

∑ ai a y el total de la clase
N n N
 = ∑ ai = a = Np
P̂ = i=1
= n i=1 n
n n
Varianza y error estándar del estimador de una proporción

ˆ = (1 − f) p(1 − p)
var(P) ˆ = var(p) + 1 = (1 − f) p(1 − p) + 1
s(P)
n −1 2n n −1 2n
Nota técnica: La distribución de p de una muestra irrestricta aleatoria se llama
distribución hipergeométrica debido a su selección sin reemplazamiento.
Estimadores en un muestreo irrestricto aleatorio
Estimador de razón
Por definición, la razón es aquella que mide la relación entre dos variables,
permitiendo su comparación, calculado generalmente por cociente.
N
1 N

j=1
yi ∑
N j=1
yi
Y
R= N = N
=
1 X

j=1
x i
N

j=1
x i

Por lo tanto, un estimador simple de R en un mia es el siguiente:

n
1 n

j=1
yi ∑
n j=1
yi
y
R̂ = n = n
=
1 x

j=1
xi ∑
n j=1
xi
Varianza y error estándar del estimador de una razón

n n n n

1−f
∑ (y j − Rx
ˆ j) 2

1−f
∑ y − 2Rˆ ∑ y j x j + Rˆ
2
j
2
∑ j
x 2

ˆ
var(R) = ⋅ j=1
= ⋅ j=1 j=1 j=1

nx 2
n −1 nx 2
n −1

y su error estándar se estima mediante:

n n n n

1−f
∑ (y j − Rx
ˆ j) 2

1−f
∑ y − 2Rˆ ∑ y j x j + Rˆ
2
j
2
∑ j
x 2

ˆ
s(R) = ⋅ j=1
= ⋅ j=1 j =1 j=1

nx n −1 nx n −1
MUESTREO ALEATORIO SISTEMÁTICO
O MUESTREO SEUDOALEATORIO
(supuesto aleatorio)
Método de muestreo que denota la selección de las unidades de
una muestra, de k en k (unidad de muestreo k-ésima), a partir de
uno de ellos elegido aleatoriamente entre los que ocupan el lugar
primero y el i-ésimo lugar en una población objeto de estudio.

n
MUESTREO ALEATORIO SISTEMÁTICO
O MUESTREO SEUDOALEATORIO
Universo “N”
2 3 4 5 6 7 8 9 10 12 13 14 15

16 17 18 19 20 22 23 24 25 26 27 28 29 30

32 33 34 35 36 37 38 39 40 42 43 44 45

46 47 48 49 50 52 53 54 55 56 57 58 59 60

Datos:
Paso 1: Selección aleatoria
N = 60
Ran# = 0.683
n=6
0.683 x 60 = 40.98 = 41
Selección aleatoria = 41
Paso 2: Intervalo K
K = 10 51 11
1 K= N/n
K = 60 / 6 = 10
Muestra 21
41 NOTA: Cuando el origen no es aleatorio (paso 1
31 selección aleatoria), el muestreo puede denominarse
rígida o estrictamente sistemático y deja de ser
probabilístico.
MUESTREO ESTRATIFICADO
Estratificación: proceso mediante el cual se agrupan los elementos de
una población conforme a determinadas características comunes.

El muestreo estratificado indica la selección a partir de varias


subpoblaciones, llamadas estratos, en los cuales se ha dividido la
población.

Razones principales para recurrir a la estratificación:

•Se pueden formar los estratos para utilizar diferentes métodos de


muestreo y procedimientos dentro de ellos (diseños muestrales
eficientes).
•Disminuir o minimizar las varianzas de las estimaciones de la
muestra; con lo que se contribuye a reducir el número de
observaciones en la muestra.
•Obtener estimaciones separadas por estrato; los estratos también
pueden ser dominios de estudio. Un dominio de estudio es una parte
de la población para la cual se han planeado estimaciones separadas
en el diseño de una muestra.
La formación de estratos requiere determinar:

1. Las variables de estratificación. -Métodos univariados.


-Métodos multivariados.

-De acuerdo a las necesidades del estudio.


2. Numero de estratos.
-Con base a la reducción de la varianza.

Criterios de varianza mínima (dado


3. Los límites de los estratos un tamaño de n se debe determinar
los límites que minimicen la varianza)
MUESTREO ESTRATIFICADO

N1 N3
N2

Afijación
Se denomina afijación, al modo
de distribuir las unidades de una
muestra entre los diferentes
estratos.
n
MUESTREO ESTRATIFICADO ALEATORIO
Si se parte de una población de N unidades elementales, que se encuentra
dividida en L subpoblaciones (estratos o subclases) de N1, N2 ….NL unidades
elementales cada uno, y posteriormente seleccionamos una muestra irrestricta
aleatoria independiente en cada estrato, entonces el procedimiento se
denomina muestreo estratificado aleatorio.

POBLACIÓN 1 POBLACIÓN 2 POBLACIÓN 3 POBLACIÓN 4

np np
np np

n1 n2 n3 n4
nT
MUESTREO POR CONGLOMERADOS O ÁREAS
Unidad de análisis:
Población de viviendas
del departamento de
Huehuetenango. N = conglomerados (que
formarán las unidades de
muestreo)

Conjunto de elementos
n = muestra de 2
conglomerados
de elementos.

Método de muestreo cuya


unidad de muestreo o de
selección, contiene más de un
elemento de la población.
Ejemplos de muestreos por
conglomerados

CONGLOMERADOS O
POBLACIÓN OBJETIVO VARIABLES ELEMENTOS UNIDADES DE
MUETREO

Características de la
Ciudad A vivienda Viviendas Manzanas

Ciudad B Compras de ropa Personas Viviendas


Información acerca Pasajeros que
Aeropuerto de viajes salen Vuelos

Universidades Planes de carreras Estudiantes Salones de clase

Gente de pueblo Actitudes sociales Adultos Pueblos


Tránsito anual en Intervalos de 40
un puente Origen y destino Vehículos minutos
MUESTREO MONOTÁPICO, BIETÁPICO,
TRIETÁPICO Y POLIETÁPICO

El muestreo bietápico, trietápico y


polietápico emplea una jerarquía
de unidades de muestreo o Muestra de primera etapa
conglomerados, de manera que el (MONOTÁPICO)
elemento pertenezca únicamente
a una unidad de muestreo en cada
etapa.
Muestra de segunda etapa
(BIETÁPICO)

Muestra de más de tres etapas


Muestra de tercera etapa
(POLIETÁPICO)
(TRIETÁPICO)
MUESTRAS NO
PROBABILÍSTICAS
MUESTREO POR CONVENIENCIA
O MUESTREO ACCIDENTAL
(MUESTRAS CASUALES O FORTUITAS)
MUESTREO POR JUICIO (SELECCIÓN EXPERTA)
MUESTREO POR CUOTAS
MUESTREO DE LA BOLA DE NIEVE

MUESTREO DE RECOMENDACIÓN
Muestreo medido
de poblaciones
(2da. y
= medido móviles
ocasión)
marcado=

Métodos
Métodos de
de captura-marca-recaptura
captura-marca-recaptura
Tamaño de la muestra
POBLACIÓN 1 POBLACIÓN 2 POBLACIÓN 3

Muestra 1
Muestra 2
Muestra 3
TAMAÑO ADECUADO DE LA MUESTRA

El tamaño de una muestra está estrechamente relacionado


con el tipo de muestreo aplicado en un estudio
(probabilístico o no probabilístico).

En muestreos de tipo no probabilístico el tamaño de la


muestra suele determinarse de la siguiente manera:

1. A través de un juicio subjetivo, intuitivo, que hace el


investigador basándose en estudios pasados.

2. En función de los costos y las limitaciones financieras de


una encuesta.
Para el caso del tamaño de la muestra en un muestreo
probabilístico, el investigador debe considerar lo precisos
que tienen que ser los estimados y de cuánto tiempo y
dinero dispone para recolectar los datos requeridos, pues
esta tarea de recolección es generalmente una de las partes
más costosas del estudio.
TAMAÑO ADECUADO DE LA MUESTRA
Hay tres factores que tienen una función importante en la
determinación de los tamaños de muestra apropiados en un
diseño muestral probabilístico (no incluyen los recursos y el
tiempo):
a. Variabilidad de la característica de población que se
investiga: Cuando mayor sea la variabilidad de la
característica, mayor será el tamaño de la muestra
necesaria.
El nivel de ingresos en Guatemala
ALTO

BAJO
b. Nivel de confianza deseado en el estimado: Cuando
más alto sea el nivel de confianza que se desee, mayor
será el tamaño de la muestra necesario.
Confianza: grado de certeza de que la estimación obtenida con la
muestra contenga al valor verdadero del parámetro. Por ejemplo, si
se dice que el nivel de confianza es de 95%, esto significa que el
valor del parámetro poblacional se encontrará dentro del
intervalo especificado en 95 de cada 100 muestras posibles.

Error asumido en el diseño muestral Nivel de confiabilidad asumido en el


diseño muestral

Error asumido en el diseño


muestral
2.5 % 95 % 2.5 %

θ
c. Grado de precisión deseado en la estimación de la
característica de la población: Cuanto más precisos
sean los resultados de la muestra que se requieren (esto
es, cuando menor sea el error), mayor será el tamaño de
muestra necesario.
GRACIAS POR SU
ATENCIÓN

You might also like