You are on page 1of 30

7.

Muestreo por Conglomerados o


Muestreo Polietpico
Cuando la poblacin contiene muchas
unidades ms o menos dispersas, puede
haber dos razones fundamentales que
impidan la toma de muestras directamente de
la poblacin:

1.- No se dispone de un marco para las
unidades de la poblacin, por que sea muy
caro o imposible construirlo.
2.- El costo del muestreo se incrementa mucho
por la dispersin de las unidades, siendo ms
deseable obtener la muestra de un modo menos
disperso.
Cuando sucede alguna de las dos situaciones
sealadas, o lo que es ms comn, ocurran
simultneamente, se recomienda el uso del
muestreo polietpico, aunque se sabe que en
general, produce varianzas mayores que un
muestreo directo de una etapa.
7. Muestreo por
Conglomerados o Muestreo
Polietpico
Por ejemplo, si se desea investigar el nmero
de personas desocupadas (definir
adecuadamente qu se entiende por
desocupado) en la Ciudad de Mxico. La
poblacin es el total de personas en edad
productiva, esto es que pueden trabajar. En
este caso no hay una lista de esas personas,
adems sera muy costoso que la muestra
quedara dispersa en toda la ciudad.
7. Muestreo por
Conglomerados o Muestreo
Polietpico
Para remediar esta situacin se pueden formar
nuevas unidades de muestreo, las llamadas
unidades primarias o unidades de primera etapa
(upm). En este caso, las unidades de primera
etapa, seran las manzanas, de las cuales s se
tiene un marco, los mapas de la ciudad. Adems,
si se seleccionan al azar (mas) un cierto
nmero de manzanas, considerando en ese
momento una poblacin de manzanas y de
cada manzana en la muestra se seleccionan al
azar (mas) un cierto nmero de personas en
edad productiva.
7. Muestreo por
Conglomerados o Muestreo
Polietpico
Para esto se debe construir previamente una
lista (marco) de las personas productivas en
las manzanas seleccionadas en la primera
etapa. Ntese que no se tiene un marco de
personas para todas las manzanas,
nicamente las que aparecen en muestra en
la primera etapa.
7. Muestreo por
Conglomerados o Muestreo
Polietpico
Algunos ejemplos de unidades primarias y unidades
secundarias de muestreo son:
Variable de
inters
Unidades
primarias
UPM
Unidades
secundarias
USM
Gasto, ingreso,
peridicos o revistas
ledas
Manzanas Familias
Produccin de
maz, carne,
leche, etc.
Municipios Predios
7. Muestreo por
Conglomerados o Muestreo
Polietpico
Variable de inters
Unidades
primarias
UPM
Unidades
secundarias
USM
Contenido de calcio,
nitrgeno, etc.
rboles Hojas o frutos
Trabajo,ingreso,
drogadiccin
Manzanas

Individuos dentro de
la manzana
Calificaciones en la
Facultad de
Ciencias.
Grupos
(por materia)
Alumnos
7. Muestreo por
Conglomerados o Muestreo
Polietpico
El muestreo de conglomerados tambin se
puede combinar con muestreo estratificado;

Por ejemplo, para los casos sealados antes,
las manzanas se pueden agrupar en colonias
o sectores segn niveles socioeconmicos.

Los municipios se pueden agrupar por estados
o por regiones ecolgicas semejantes.
7. Muestreo por
Conglomerados o Muestreo
Polietpico
El principio bsico para construir estimadores y sus
varianzas en muestreo bietpico, es considerar el
muestreo de unidades secundarias dentro de cada
unidad primaria y obtener estimadores de totales de Y
y sus varianzas en cada una de las upm en muestra.

Posteriormente, usando los estimadores para cada
unidad primaria muestreada, es necesario considerar
un muestreo de unidades primarias, con el fin estimar
totales en toda la poblacin.
7. Muestreo por
Conglomerados o Muestreo
Polietpico
NOTACIN

Valores poblacionales (No dependen de un
diseo de muestra o estimadores)

N nmero de unidades primarias de
muestreo (upm). Se cuenta con un
marco de muestreo para las N upm.

M
i
nmero de unidades secundarias (usm)
en la unidad primaria i-sima.
7. Muestreo por
Conglomerados o Muestreo
Polietpico
Nmero total de (usm).
Normalmente no se conoce .

Y
ij
valor de la medicin en la unidad
secundaria j-sima dentro de la
unidad primaria i-sima.



total de los valores Y
ij
de la
unidad primaria i-sima,
1
N
i
i
M M
=
=

1
i
M
i ij
j
Y Y
=
=

7. Muestreo por
Conglomerados o Muestreo
Polietpico
promedio de la unidad primaria i-sima,





total de la unidad primaria i-sima.

Y

total de los valores de Y en la
poblacin,
i
Y
1
1 1
i
M
i i ij
j
i i
Y Y Y
M M
=
= =

i i i
Y M Y =
1 1 1
i
M
N N
i ij
i i j
Y Y NY Y
= = =
= = =

7. Muestreo por
Conglomerados o Muestreo
Polietpico
promedio de los totales de
unidades primarias. Este promedio
de totales es completamente
diferente al promedio por elemento.

promedio por elemento.
1
1
N
i
i
Y Y
N
=
=

1
e
N
i
i
Y Y
Y
M
M
=
= =

7. Muestreo por
Conglomerados o Muestreo
Polietpico
varianza entre unidades
secundarias dentro de la
unidad primaria i-sima.


varianza entre totales
de unidades
primarias.
2
1
2
( )
1
i
M
ij i
j
wi
i
Y Y
S
M
=

=

2
2
1
( )
1
N
i
i
b
Y Y
S
N
=

=

7. Muestreo por
Conglomerados o Muestreo
Polietpico
Como un primer acercamiento para construir
estimadores, se considera mas para upm y
tambin mas para usm. Pero puede
haber otras formas de tomar la muestra
en ambas etapas.
7. Muestreo por
Conglomerados o Muestreo
Polietpico
Valores muestrales

n unidades primarias en muestra.

m
i
nmero de unidades secundarias
muestreadas de las que contiene la
unidad primaria i-sima en muestra

promedio de la muestra de
unidades secundarias de la
unidad primaria i-sima.
1
1

i
m
i i ij
j
i
Y y y
m
=
= =

7. Muestreo por
Conglomerados o Muestreo
Polietpico
total estimado de la unidad
primaria i-sima.

varianza estimada entre
unidades secundarias
dentro de la upm i.
(7.1)

promedio estimado de totales
estimados de upm.

i i i
Y M Y =
( )
2
1
2

1
i
m
ij i
j
wi
i
y y
S
m
=

=

1
1

n
i
i
Y Y
n
=
=

7. Muestreo por
Conglomerados o Muestreo
Polietpico
total estimado para la poblacin





(7.2)

Y N Y =
1 1
Factores de
expansin f
i




i
n
m i
n n
i
i i i ij
i i j
i
n m
i
ij
i j
i
Y
N N
Y N M y M y
n n n m
M N
y
n m
= =
= = =
=

7. Muestreo por
Conglomerados o Muestreo
Polietpico
Si m
i
es proporcional a M
i
entonces
el diseo es autoponderado, es decir,
los factores de expansin son iguales,

i
i
M
k
m
=
, 1,..., , 1,..., .
ij i
N
f f k j m i n
n
= = = =
7. Muestreo por
Conglomerados o Muestreo
Polietpico
La varianza estimada entre totales estimados
de unidades primarias; es:
( )
2
1
2

1 1
2
1 1

n
S Y Y
i
b
n i
n n
M Y M y
i i i i
i i n n
Y
i
Y
=
=
=

| |
|
|
|
|
\ .
7. Muestreo por
Conglomerados o Muestreo
Polietpico
La varianza terica del estimador del total es:






(7.3)
(1)
1 1 1 1
2 2 2 2

( )
90% 95%del
escerosi

valor de ( )
N
N
V Y N S M S
i wi
b
i n N n m M
i i
m M
i i
V Y
=

=
| |
| |
+
|
|
|
\ .
\ .
7. Muestreo por
Conglomerados o Muestreo
Polietpico
En la gran mayora de las encuestas, en general de los
muestreos, los valores de Y
ij
son semejantes dentro de las
upm. Esto hace que las S
2
wi
tiendan a ser pequeas.
Tambin los valores de las Y
ij
son ms diferentes entre
upm; adems, los totales Y
i
difieren mucho si el nmero M
i

de usm, dentro de las upm son diferentes; y finalmente en
S
2
b
se tiene varianza entre totales, no entre valores
individuales. Todo esto hace que la primera parte de (7.3)
constituya frecuentemente un 90 a 95% o incluso mas del
valor total de la varianza del estimador del total.
7. Muestreo por
Conglomerados o Muestreo
Polietpico
7. Muestreo por
Conglomerados o Muestreo
Polietpico
Como los valores de las Y
ij
tienden a ser parecidos
en cada una de las upm
i
, entonces se genera una
correlacin, llamada correlacin
intraconglomerado. Esta correlacin hace que la
informacin tenga cierta redundancia, lo que se
refleja en varianzas de los estimadores mayores
que la que se obtendra con un muestreo directo
unietpico de las unidades.
En algunos textos de muestreo se trata el
tema de muestreo de conglomerados. Este
es el que surge si en cada upm se estudian
todas (se censa) las usm. En este caso m
i
=M
i

y entonces el segundo trmino de (7.3) se
hace cero. Esto en realidad corresponde a un
muestreo de una etapa, donde las upm son las
unidades de muestreo nicas y a cada una de
ellas se le asocia (se determina) Y
i
, el total de
los Y
ij
en su interior.
7. Muestreo por
Conglomerados o Muestreo
Polietpico
La varianza del total, (7.3) se estima
mediante




As una estimacin por intervalo, al 95%
aproximado para el total Y ser:
2 2 2 2
1 1 1 1

( )
n
b i wi
i
i i
N
V Y N S M S
n N n m M
| |
| |
= +
|
|
\ .
\ .

(7.4)

1.96 ( ) 1.96 ( ) 0.95 [ ] P Y V Y Y Y V Y < < + =
(7.5)
7. Muestreo por
Conglomerados o Muestreo
Polietpico
Si se considera que el primer trmino de (7.3)
representa la mayor parte (95% o ms) de su valor,
es decir, se desprecia la variacin entre usm dentro
de upm, se tiene:



de aqu despejamos n
2 2
1 1

1.96 ( ) 1.96 ( )
b
V Y N S
n N
o = =
2 2
2 2
2 2
(1.96) 1
1
(1.96)
b
b
S
n
S N
o o
= =
+
7. Muestreo por Conglomerados
o Muestreo Polietpico
Un caso prctico es cuando las muestras de unidades
secundarias en cada unidad primaria son del mismo
tamao m
i
= m. Si adems se hace el supuesto, poco
realista de que M
i
= M
*
, las unidades primarias tienen
el mismo nmero de unidades secundarias, se tiene:
*

,
n m
ij
i j
N M
Y y
n m
| |
| |
=
| |
\ .
\ .

2 2
1
N
w wi
i
S S
N
=

( )
2
2
2 2 2 *
*
1

( ) 1 1
w
b
S n m
V Y N S N M
n N mn M
| | | |
= +
| |
\ . \ .
(7.6)
7. Muestreo por Conglomerados
o Muestreo Polietpico
Si en este caso se considera que el costo de localizar y
elaborar el marco de las unidades secundarias que
contiene una unidad primaria es C
1
y el de obtener
informacin sobre una unidad secundaria es C
2
, el costo
total ser

De aqu, los valores de n y m ptimos, esto es, los que
minimizan V( ) en (7.6) manteniendo el costo fijo C
0
,
son:
1 2
. C nC nmC = +
( )
1 2 *
1
2 * 2 2
/
W
b w
C C
m M S
S M S
=

(7.7)

Y
7. Muestreo por Conglomerados
o Muestreo Polietpico
Ntese que el nmero de unidades
secundarias a muestrearse en cada unidad
primaria ser mayor si S
2
w
es mayor, o si el
costo por unidad primaria es mayor, o el
costo por unidad secundaria es menor, o
bien si S
2
b
es menor.

Con el valor de m se obtiene el de n:
0
1 2
C
n
C C m
=
+
(7.8)
7. Muestreo por Conglomerados
o Muestreo Polietpico
Ntese que para estimar el promedio de toda la
poblacin o promedio por el elemento



es necesario el conocimiento de los valores M
i
para
todas las unidades; esto no siempre es factible, por lo
que se debe usar el llamado estimador de razn.
1
,
e
N
i
i
Y
Y
M
=
=

7. Muestreo por Conglomerados


o Muestreo Polietpico

You might also like