You are on page 1of 11

213

DETERMINACIN DEL TAMAO DE LA MUESTRA


PARA ENCUESTAS DE HOGARES EN DOS ETAPAS
CONSIDERANDO EL EFECTO DE DISEO
1






PEDRO LUIS DO NASCIMENTO SILVA
2


ZLIA MAGALHES BIANCHINI
3


INSTITUTO BRASILEIRO DE GEOGRAFA E ESTATSTICA (IBGE)


1
Para presentarse en el 10 Taller Regional del MECOVI: La Prctica del Muestreo para el Diseo de las Encuestas de Hogares, 27 al 29 de
noviembre, Buenos Aires, Argentina.
2
Direccin: IBGE - Diretoria de Pesquisas, Av. Repblica do Chile 500, 10
o
andar - Rio de Janeiro - RJ - 20031-170 - Brasil - e-mail:
pedrosilva@ibge.gov.br .
3
Direccin: IBGE - Diretoria de Pesquisas , Av. Repblica do Chile 500, 10
o
andar - Rio de Janeiro - RJ - 20031-170 - Brasil - e-mail:
zbianchi@ibge.gov.br .
214 Determinacin del tamao de la muestra para encuestas...

NDICE

Pgina

1. Introduccin ......................................................................................................................... 215
2. Diseo de la Muestra y el Efecto de Diseo ........................................................................ 215
3. Clculo del Tamao en el Muestreo Aleatorio Simple (MAS) ............................................ 217
4. Clculo del Tamao de la Muestra de Conglomerados en dos Etapas................................. 219
5. Consideraciones Finales....................................................................................................... 222
6. Referencias........................................................................................................................... 223
Determinacin del tamao de la muestra para encuestas... 215

1. Introduccin
El objetivo principal del presente documento es describir los procedimientos ms empleados para el
clculo del tamao de la muestra, al momento de seleccionar la tcnica a emplear para la realizacin de
una encuesta por muestreo de hogares.
La especificacin de los tamaos de la muestra necesarios en una encuesta muestral es una tarea de gran
importancia, por ser la instancia de compatibilizacin de los objetivos de la encuesta (y de los clientes)
con los recursos disponibles para la implementacin de la encuesta.
Una decisin importante en cualquier planeamiento es la definicin del tamao de la muestra que se
seleccionar. Para tomar esta decisin hay dos caminos posibles. El primero es fijar el presupuesto de la
encuesta, y partiendo de all, determinar el mayor tamao de muestra posible segn los recursos
disponibles. El segundo, es especificar uno o ms blancos de inferencia y el margen de error aceptable en
la estimacin de estas cantidades y, con estos parmetros y algn conocimiento sobre la estructura de
variacin de las variables de inters en la poblacin, determinar el tamao mnimo de la muestra que
satisfaga los requisitos de precisin establecidos.
Un recurso esencial cuando se pretende seguir esta segunda ruta para definir los tamaos de la muestra, es
disponer de informacin sobre la estructura de variacin de las variables de inters en la poblacin. Tal
informacin puede venir de censos, pero en la mayora de las veces se tienen que obtener tambin a partir
de encuestas muestrales anteriormente realizadas. Lamentablemente, no son muchas las encuestas
(censales o muestrales) que publican el tipo de informacin requerida, como se ver ms adelante.
Cuando la muestra que se est planeando es requerida para levantar una encuesta de hogares, en la cual se
emplear un muestreo conglomerado a partir de los marcos de la base geogrfica del IBGE, una de las
informaciones importantes es el coeficiente de correlacin intraclase. Este coeficiente consiste en una
medida resumen de la homogeneidad verificada entre las unidades (hogares o personas) situadas dentro de
un mismo conglomerado. En el caso de los marcos derivados de la base geogrfica del IBGE, los
conglomerados de inters son generalmente los sectores censales.
Nascimento Silva & Moura (1986) hicieron una amplia y detallada revisin sobre la definicin y
utilizacin de los coeficientes de correlacin intraclase en muestreos para encuestas de hogares, de la cual
sacaremos algunos resultados que se demostraron por los referidos autores.

2. Diseo de la Muestra y el Efecto de Diseo
Tomaremos como ejemplo que nuestra encuesta de inters emplear un diseo de conglomerado en dos
etapas, con estratificacin en la primera etapa del muestreo. Sin embargo, el ejemplo anterior no pierde
generalidad, por cuanto las ideas siguientes pueden adoptarse para diseos muestrales con un nmero
mayor o menor de estratos. La estratificacin principal ser geogrfica y se definir de modo que cada
estrato corresponda a un dominio de inters para la divulgacin de los resultados en separado.
La descripcin del diseo de la muestra que sigue es la que se adoptar dentro de cada uno de los estratos
geogrficos (o estratos naturales) as definidos. La muestra total se obtendr por la unin de las muestras
seleccionadas de forma independiente en los estratos naturales. Para simplificar la anotacin y la
descripcin de los resultados, no se definir un ndice para representar los estratos naturales, entendiendo
que lo que sigue es vlido para cada uno de los estratos naturales definidos.
En cada estrato natural, la muestra de la encuesta se obtendr en dos etapas de seleccin. Primero, se
seleccionarn los sectores censales (las unidades primarias de muestreo UPAs de la encuesta), a travs
de un mtodo de seleccin con probabilidades proporcionales al tamao (PPT). La medida de tamao a
ser considerada en la seleccin de los sectores con PPT ser el nmero total de viviendas particulares
permanentes (DPP) obtenido del marco de seleccin (generalmente, basado en las informaciones del
ltimo Censo Demogrfico realizado por el IBGE). En cada un de los sectores censales seleccionados en
216 Determinacin del tamao de la muestra para encuestas...
la primera etapa se realizar una operacin de listado para crear el marco de las viviendas particulares
permanentes e identificacin de los hogares elegibles. Los hogares elegibles sern las viviendas
particulares permanentes ocupadas en la ocasin del listado, en las cuales residan personas elegibles para
la encuesta.
En la segunda etapa, se seleccionar, en cada uno de los sectores definidos en la primera etapa, una
muestra de hogares elegibles entre los identificados en el sector mediante un mtodo de seleccin con
igual probabilidad para las alternativas (estadsticamente, mediante el mtodo de muestreo aleatorio
simple o muestreo sistemtico simple). Los hogares sern, entonces, las unidades secundarias del
muestreo (USAs). Para fines del desarrollo terico presentado en este informe, se supone que la seleccin
de los hogares elegibles en cada sector se har por muestreo aleatorio simple (MAS). Aunque el muestreo
sea sistemtico, no habr problemas por haberse adoptado esa hiptesis simplificadora.
El nmero de hogares elegibles que debern seleccionarse en cada sector se fijar previamente, y tendr
valor igual o constante para todos los sectores de un mismo estrato natural. Tal nmero, que denotaremos
por d, podr eventualmente variar de un estrato natural para otro.
En cada una de los hogares elegibles seleccionados, todas las personas elegibles sern entrevistadas, no
habiendo, por lo tanto, una tercera etapa de seleccin.
Bajo esas hiptesis, Nascimento Silva & Moura (1986:31) demostraron que el efecto del diseo de la
muestra en dos etapas descrito (abreviaremos este diseo por PPT2) para estimadores de total (y tambin
de media) viene dado por:
c
MAS
w PPT2
w
1)! (d 1
) x ( V
) x ( V
PPT2) ; x EPA( + = = (1)
donde
w
x es el estimador natural (o de Horvitz-Thompson) para la media poblacional X de una
variable de inters x cualquier;
PPT2) ; x EPA(
w
es el efecto del diseo de la muestra conglomerada en dos etapas con seleccin PPT de
los sectores en la primera etapa (Pessoa & Nascimento Silva, 1998:54);
) x ( V
w PPT2
es la varianza del estimador natural de media
w
x bajo el diseo de la muestra
conglomerada en dos etapas;
) x ( V
MAS
es la varianza del estimador natural de media x bajo un diseo de la muestra aleatorio
simple (hipottico, en el caso);
d es el nmero de hogares elegibles (o personas) seleccionadas por sector;
c
! es el coeficiente de correlacin intraclase de la variable x para los conglomerados
(sectores), conforme definido en Nascimento Silva & Moura (1986:18).

Las medidas de efecto del diseo de la muestra (EPAs) pueden ser estimadas para diversas variables de
hogares y de personas, usando datos de encuestas pasadas, generalmente encuestas muestrales similares o
en las cuales se hayan tratado temas correlatos a los de la encuesta de inters.
Con las estimativas de los EPAs para algunas variables de inters de la encuesta actual, y conociendo los
valores d usados en la encuesta pasada de donde los EPAs fueron estimados, se pueden obtener
estimaciones indirectas del coeficiente de correlacin intraclase
c
! . Tales estimaciones se pueden obtener
simplemente solucionando la ecuacin (1) en trminos del valor de
c
!
c
y sustituyendo los valores de EPA
y d obtenidos de la encuesta pasada, es decir:

Determinacin del tamao de la muestra para encuestas... 217

1 d
1 - ) x epa(
!
w
c

= (2)
donde
c
! es la estimacin indirecta para el coeficiente de correlacin intraclase de la variable x para
los conglomerados / sectores;
) x epa(
w
es la estimacin basada en la encuesta pasada para el efecto del diseo de la muestra del
estimador de media en un plano conglomerado en dos etapas con PPT.

Los valores de
c
! as estimados pueden, a su vez, usarse para calcular tamaos de muestra para una
nueva encuesta mediante un proceso en dos etapas, que a continuacin se decribe.

3. Clculo del Tamao en el Muestreo Aleatorio Simple (MAS)
Considerando los requisitos de precisin establecidos para la encuesta de comn acuerdo con el cliente, se
define el margen de error aceptable para el estimador muestral, suponiendo que la muestra sera MAS.
As, para estimar la media con un error mximo relativo de k
r
al nivel de confianza del 95%, basta fijar:
2
r
MAS
1,96
X k
) x ( V


= (3)

Como se sabe (Cochran, 1977:23) que:

2
x MAS
S
N
1
n
1
) x ( V

= (4)

donde n es el tamao total de la muestra de hogares (personas) deseado, N es el nmero total de hogares
(personas), y
2
x
S es la varianza poblacional de la variable de inters x, entonces basta juntar (3) y (4) para
obtener una ecuacin que relaciona el tamao total de la muestra deseada n con los requisitos de precisin
especificados:


2
r 2
x
1,96
X k
S
N
1
n
1

(5)

Solucionando la ecuacin (5) en trminos del valor de n, se obtiene:

2
x
2
2
r
2
x
MAS
V
N
1
1,96
k
V
n
+
= (6)
donde
2
x
V es la varianza relativa poblacional de la variable y, dada por
2
2
x
2
x
X
S
V = , y
MAS
n es el
tamao de la muestra aleatoria simple que sera requerida para estimar la media poblacional con el error
relativo mximo aceptable k
r
.
Una aproximacin usual para
MAS
n que se puede usar siempre que la poblacin sea grande (se supone
que N) viene dada por:
218 Determinacin del tamao de la muestra para encuestas...
2
r
2
x
2
MAS
k
V 1,96
n

= (7)
Esta expresin simple depende del valor desconocido
2
x
V . Sin embargo, para un gran nmero de
situaciones de inters prctico, es posible estimar o establecer una cuota superior para ese valor, y con
eso, determinar un tamao de muestra que funcione bien para estimar la media con el margen de error
controlado, cualquiera que sea el verdadero valor de
2
x
V menor o igual que el valor de esta cuota
superior.
Para dar un ejemplo concreto, cuando x es una variable indicadora de la posesin de un atributo o
cualquier caracterstica, se sabe que:

P
P 1
P
P) P(1
V
2
2
x

= (8)

donde P es la proporcin de unidades en la poblacin que posee el atributo de inters (y tambin la media
poblacional de la variable x).
En este caso, es fcil verificar que
2
x
V es una funcin montona decreciente de P, para P en el intervalo
(0;1). Luego, en el caso que la encuesta tenga que estimar proporciones iguales o mayores que P
0

(digamos, P
0
= 0,05 = 5%) con un error relativo mximo de k
r
= 0,40 = 40%, se tendr:

19
05 , 0
95 , 0
P
P 1
V
0
0 2
x
= =



y, por lo tanto, basta emplear el tamao de la muestra igual a

457
40 , 0
9 1 1,96
k
V 1,96
n
2
2
2
r
2
x
2
MAS

= .

Un camino alternativo, que muchas veces tambin se emplea en la prctica, consiste en determinar el
tamao de la muestra aleatoria simple para garantizar que el error mximo admisible (ntese que no es el
error relativo, sino el error absoluto) de una estimacin de cualquier proporcin no sobrepase k. En ese
caso, la modificacin a hacerse es simple, bastando sustituir el clculo de
MAS
n , utilizando la expresin
siguiente:
2
2
MAS
k 4
1,96
n

= (9)

Es importante recalcar que la expresin (9) es vlida para cualquier proporcin poblacional P.
Para usar la expresin (9) con los datos de nuestro ejemplo, ntese que un error relativo mximo del 40%
en una estimativa de proporcin del 5% equivale a fijar un error absoluto mximo del 2% en el valor de la
proporcin. As, haciendo k=0,02 y usando la expresin (9) para calcular el tamao total de la muestra, se
obtiene:

401 . 2
02 , 0 4
1,96
n
2
2
MAS
=

= .

Determinacin del tamao de la muestra para encuestas... 219

Se verifica una aparente contradiccin en los resultados obtenidos con (7) (9). En realidad, no hay
contradiccin. Ocurre que establecer un error relativo mximo del 40% para proporciones del 5% o ms
corresponde, para proporciones del 50%, a un error (absoluto) mximo del 20% o veinte puntos
porcentuales. Como la expresin (9) es derivada suponiendo que la varianza de la proporcin muestral
usada para estimar la proporcin poblacional es mxima, lo que ocurre cuando P=1/2=50%, se verifica
que el error mximo aceptable para una proporcin cualquiera puede llegar hasta el 20% (k=0,2) cuando
se usa el mtodo de la ecuacin (7) en este ejemplo, y slo el 2% (k=0,02) cuando se usa la ecuacin (9),
fijado el mismo nivel de error relativo mximo aceptable k
r
= 0,4 = 40% para proporciones del 0,05 o
ms.
El enfoque que usaremos aqu es el ms conservador, que consiste en fijar el error mximo admisible para
estimar proporciones en valor absoluto y no en valor relativo. Por lo tanto, usaremos la expresin (9) para
calcular tamaos de muestra en el restante del texto.
Hecha esa seleccin,
MAS
n = 2.401 sera el tamao mnimo de la muestra necesaria para estimar
cualquier proporcin poblacional con un error (absoluto) mximo del 2%, si la muestra fuese aleatoria
simple.

4. Clculo del Tamao de la Muestra de Conglomerados en dos Etapas
Si la muestra de inters es, en realidad, conglomerada, tendremos algunas efectos sobre la varianza de del
estimador de media, que pueden ser medidos por el EPA ver ecuacin (1) . As, la varianza del
estimador ser generalmente mayor, y vendr dado por la siguiente expresin:

) x ( V PPT2) ; x EPA( ) x ( ]V 1)! (d 1 [ ) x ( V
MAS w MAS c w PPT2
= + = (10)

Partiendo de la expresin (10), es fcil demostrar que el tamao de la muestra conglomerada necesaria
para estimar la media con el mismo error relativo mximo se da simplemente por:

MAS c MAS PPT2
n ] 1)! (d 1 [ n EPA n + = = (11)

donde
PPT2
n es el tamao de la muestra necesaria bajo el diseo de la muestra conglomerada en las dos
etapas consideradas.
Retomando la situacin donde se quiere estimar proporciones con un error mximo del 2%, y
401 . 2 n
MAS
= , el tamao de la muestra conglomerada necesaria sera igual a:

401 . 2 EPA n EPA n
MAS PPT2
= = (12)

Este clculo puede hacerse basndose en el valor del EPA estimado a partir de una encuesta pasada y
suponiendo que el grado de conglomeracin de la muestra de la encuesta sera exactamente el mismo que
el de la encuesta anterior. Sin embargo, tambin es posible precisar este clculo, ya que se puede calcular
el EPA usando la estimacin indirecta del coeficiente de correlacin intraclase dada en la expresin (2)
para muestras con cualquier nmero d de USAs (hogares o personas) seleccionadas por sector.
Con la estimacin del coeficiente de correlacin intraclase, se puede recalcular el tamao de la muestra
conglomerada para otros valores del nmero de hogares a entrevistarse por sector.
En Nascimento Silva & Moura (1986) se presentan valores para coeficientes de correlacin intraclase
(
c
! ) calculados para 33 variables categricas para cada una de 11 reas, siendo 9 Regiones
Metropolitanas, el Distrito Federal y el municipio de Goinia, usando las informaciones del Censo
Demogrfico de 1980. Los resultados de ese estudio muestran una gran variacin para los coeficientes de
220 Determinacin del tamao de la muestra para encuestas...
correlacin intraclase entre las variables y entre las reas. La variable con menor valor para
c
! , alrededor
de 0,01 es hogares con 3, 4 o 5 moradores y la variable con mayor valor, alrededor de 0,45 es hogares
que tienen telfono, para el Distrito Federal.
A modo de ejemplo, ybconsiderando algunos valores fijos para
c
! en el intervalo 50 , 0 ! 01 , 0
c
y para
d (nmero de hogares que se seleccionarn por sector) y aplicndose la expresin
c
1)! (d 1 EPA + = , se
calcularon los valores para el EPA - efecto de diseo de la muestra conglomerada en 2 etapas con
seleccin PPT de los sectores en la primera etapa -. Los resultados se presentan en la tabla 1, a
continuacin.

Tabla 1 - Efecto de diseo de la muestra (EPA) para diferentes valores de
c
! ,
por nmerode hogares que se entrevistarn por sector

Coeficiente de Correlacin Intraclase
c
!
Hogares que se
entrevistarn
por sector (d)
0,01 0,05 0,1 0,2 0,3 0,4 0,5
5 1,04 1,20 1,40 1,80 2,20 2,60 3,00
8 1,07 1,35 1,70 2,40 3,10 3,80 4,50
10 1,09 1,45 1,90 2,80 3,70 4,60 5,50
13 1,12 1,60 2,20 3,40 4,60 5,80 7,00
16 1,15 1,75 2,50 4,00 5,50 7,00 8,50
20 1,19 1,95 2,90 4,80 6,70 8,60 10,50
24 1,23 2,15 3,30 5,60 7,90 10,20 12,50
30 1,29 2,45 3,90 6,80 9,70 12,60 15,50
40 1,39 2,95 4,90 8,80 12,70 16,60 20,50

El grfico 1 presenta el diagrama de dispersin de los valores del EPA por nmero de hogares que se
entrevistarn por sector para los coeficientes de correlacin intraclase con valores menores: 0,01; 0,05 y
0,1, respectivamente. El grfico 2, en tanto, presenta el diagrama para los valores mayores del coeficiente
de correlacin intraclase considerado: 0,2 a 0,5.
Grfico 1 - EPA por coeficiente de correlacin intraclase
y n de hogares que se entrevistarn por sector
0
1
2
3
4
5
6
0 10 20 30 40
Hogares que se entrevistarn por sector (d)
EPA
0,1 !
c
=
0,05 !
c
=
0,01 !
c
=
Determinacin del tamao de la muestra para encuestas... 221




La tabla 2 presenta los respectivos tamaos de hogares en la muestra para cada valor de EPA obtenido en
la tabla 1, utilizando la expresin (12), o sea: 401 . 2 EPA n EPA n
MAS PPT2
= = .

Tabla 2 Tamao de la muestra de hogares para diferentes valores de
c
! ,
por nmero de hogares que se entrevistarn por sector

Coeficiente de Correlacin Intraclasse
c
!
Hogares que se
entrevistarn
por sector (d)
0,01 0,05 0,1 0,2 0,3 0,4 0,5
5 2.497 2.881 3.361 4.322 5.282 6.243 7.203
8 2.569 3.241 4.082 5.762 7.443 9.124 10.805
10 2.617 3.481 4.562 6.723 8.884 11.045 13.206
13 2.689 3.842 5.282 8.163 11.045 13.926 16.807
16 2.761 4.202 6.003 9.604 13.206 16.807 20.409
20 2.857 4.682 6.963 11.525 16.087 20.649 25.211
24 2.953 5.162 7.923 13.446 18.968 24.490 30.013
30 3.097 5.882 9.364 16.327 23.290 30.253 37.216
40 3.337 7.083 11.765 21.129 30.493 39.857 49.221

Para implementar la muestra conglomerada, faltara an definir el nmero de sectores a seleccionar en la
primera etapa, pero este nmero queda definido implcitamente cuando el tamao total de la muestra es
calculado, siendo:

d
n
m
PPT2
PPT2
= (13)
0,05 !
c
=
Gr f ico 2 - EPA por coe f icie nt e de cor r e lacin int r aclas s e y n
de hogar e s que s e e nt r e vis t ar n por s e ct or
0
5
10
15
20
25
0 10 20 30 40
Hogar e s que s e e nt r e vis t ar n por s e ct or ( d)
EPA
4 , 0 !
c
=
3 0 !
c
=
2 , 0 !
c
=
5 0 !
c
=
0,01 !
c
=
222 Determinacin del tamao de la muestra para encuestas...
La tabla 3 presenta los respectivos nmero de sectores en la muestra para cada tamao de muestra de
hogares obtenido en la tabla 2, utilizando la expresin (13).

Tabla 3 Nmero de sectores en la muestra para diferentes valores de
c
! ,
por nmero de hogares que se entrevistarn por sector
Coeficiente de Correlacin Intraclase
c
!

Hogares que se
entrevistarn por
sector (d)
0.01 0,05 0,1 0,2 0,3 0,4 0,5
5 499 576 672 864 1.056 1.249 1.441
8 321 405 510 720 930 1.140 1.351
10 262 348 456 672 888 1.104 1.321
13 207 296 406 628 850 1.071 1.293
16 173 263 375 600 825 1.050 1.276
20 143 234 348 576 804 1.032 1.261
24 123 215 330 560 790 1.020 1.251
30 103 196 312 544 776 1.008 1.241
40 83 177 294 528 762 996 1.231

El siguiente paso requerido, es la seleccin de la combinacin del nmero de sectores en la muestra y del
nmero de hogares que se considerarn por sector que nos lleve al tamao total de la muestra que d el
mejor resultado para el propsito de la encuesta. Una solucin para el problema podra obtenerse tomando
en cuenta la funcin de costos, que indica el costo de la aplicacin del diseo de la muestra para los
tamaos de unidades de la 1 y 2 etapa y obtener los tamaos de muestra que puedan minimizar esta
funcin con la precisin fijada.
Cabe sealar que, naturalmente, la seleccin del mejor nmero de hogares que se entrevistarn por sector
(d) debe tener en cuenta la seguridad de funcionamiento del equipo de campo.

5. Consideraciones finales
En resumen, para determinar el tamao de la muestra para una encuesta, bastara seguir el siguiente
esquema:
1. Elegir una variable y un parmetro (por ejemplo: media o proporcin) que se desea estimar.
2. Fijar el margen de error (relativo o absoluto) mximo admisible en la estimacin de este
parmetro.
3. Calcular usando la ecuacin (7) o (9) un tamao de muestra aleatoria simple necesario para
la encuesta, en el caso que este fuese el diseo de la muestra a adoptar.
4. Estimar en base a alguna encuesta anterior el valor del coeficiente de correlacin intraclase o
el EPA para la variable de inters (ver por ejemplo Nascimento Silva & Moura, 1986).
5. Calcular el valor del tamao que la muestra conglomerada deba tener para estimar el
parmetro con el mismo margen de error, para varios valores alternativos de d, usando la
expresin (11).
6. Calcular el nmero de sectores en la muestra conglomerada usando la expresin (13), es
decir:
Determinacin del tamao de la muestra para encuestas... 223

d
n
m
PPT2
PPT2
= .
7. Elegir la combinacin de tamao total de la muestra y de nmero de sectores en la muestra
que d el mejor resultado en trminos de una funcin de los costos de la encuesta.

En el caso que la encuesta tenga varias variables principales, para definir el tamao de la muestra, deber
replicarse el esquema anterior para cada una de estas variables, y tomar alguna regla de decisin para el
tamao de la muestra a seleccionarse. Por ejemplo, una regla conservadora consistira en usar el tamao
mximo obtenido entre las diversas variables, pero esta regla generalmente es difcil de adoptar en la
prctica, pues implica un costo muy elevado. Otra alternativa es usar el valor medio de los tamaos de la
muestra calculados.
Una estrategia que se considerar para mejorar la eficiencia del diseo de la muestra, es la utilizacin de
estratificacin de UPAs con base en una o ms variables con alta correlacin, en variables que poseen
valores altos del coeficiente de correlacin intraclase. En este caso, en la medida en que se definan los
estratos, los valores de
c
! para cada estrato declinarn considerablemente, pudiendo, incluso, asumir
valores negativos (vase IBGE (1991:141-153). Entonces, podra obtenerse un aumento de la eficiencia
del diseo, con el tamao de la muestra determinado para un pequeo valor del coeficiente de
correlacin intraclase.
Finalmente, vale mencionar el trabajo UNSD (2002), preparado por Nascimento Silva, en el cual se
presentan valores estimados del efecto del diseo de la muestra para un conjunto de variables
seleccionadas de encuestas de hogares conducidas por el IBGE, como la Encuesta Nacional por Muestra
de Hogares (Pesquisa Nacional de Amostra de Domiclios) PNAD de 1999, la Encuesta Mensual de
Empleo (Pesquisa Mensal de Emprego ) PME de septiembre de 1999 y la Encuesta sobre Estndares de
Vida (Pesquisa sobre Padres de Vida ) de 1996-97. En este caso, el efecto de diseo medido incluye el
diseo de la muestra de cada encuesta, abarcando la estratificacin y el mtodo de estimacin, que utiliza
estimadores de razn.

6. Referencias
Cochran, W. G., 1977. Sampling Techniques, 3
nd
edition. Nova Iorque: John Wiley & Sons.
IBGE, 1991. Pesquisa de oramentos familiares: aspectos de amostragem. Rio de Janeiro: IBGE, 1991.
V.3. (Srie relatrios metodolgicos, v.10).
Nascimento Silva, P. L. do, 2002. Determinao do tamanho de amostra para pesquisa domiciliar
conglomerada em dois estgios. Rio de Janeiro: IBGE, ENCE (aula do Curso de Amostragem do
Mestrado).
Nascimento Silva, P. L. do & Moura, F. A. S., 1986. Efeito de conglomerao da malha setorial do
Censo Demogrfico de 1980. Rio de Janeiro: IBGE, Diretoria de Pesquisas, Srie Textos para
Discusso, n.32.
Pessoa, D. G. C. & Nascimento Silva, P. L. do, 1998. Anlise de Dados Amostrais Complexos. So Paulo:
Associao Brasileira de Estatstica.
UNSD, 2002. An Analysis of Operating Characteristics of Household Surveys in Developing and
Transition Countries: An analysis of design effects for sample surveys conducted in Brazil. Draft,
September 2002. Nova Iorque: Naes Unidas, Diviso de Estatstica (preparado por Nascimento
Silva, P.L. do ).

You might also like