Professional Documents
Culture Documents
ENDUTIH
Diseo muestral
Obras complementarias publicadas por el INEGI sobre el tema:
Estadsticas sobre Disponibilidad y uso de las Tecnologas de Informacin y Comunicaciones en los Hogares, 2005,
2006, 2007, 2008, 2009, 2010, 2011, 2013, 2014 y 2015.
13 p.
Conociendo Mxico
1. Objetivo de la encuesta 1
2. Poblacin objetivo 1
3. Cobertura geogrca 1
INEGI. Encuesta Nacional sobre Disponibilidad y Uso de Tecnologas de la Informacin en los Hogares 2016. ENDUTIH. Diseo muestral. 2017
4. Marco de la encuesta 1
4.1 Formacin de las unidades primarias
de muestreo (UPM) 1
a) En urbano alto 1
b) En complemento urbano 1
c) En rural 1
4.2 Estraticacin 2
5. Tamao de la muestra 2
6. Ajacin de la muestra 3
7. Seleccin de la muestra 3
7.1. En urbano alto 3
7.2. En complemento urbano 4
7.3. En rural 4
9. Estimadores 5
Anexo
2. Poblacin objetivo
La encuesta est dirigida a las personas de seis aos cumplidos o ms que residen permanentemente en viviendas
particulares ubicadas en el territorio nacional a la fecha del levantamiento.
3. Cobertura geogrca
INEGI. Encuesta Nacional sobre Disponibilidad y Uso de Tecnologas de la Informacin en los Hogares 2016. ENDUTIH. Diseo muestral. 2017
La encuesta esta diseada para dar resultados para los siguientes dominios de estudio:
Nacional
Entidad
Ciudad
4. Marco de la encuesta
El diseo de la muestra para la ENDUTIH-2016 se caracteriza por ser probabilstico, por lo cual los resultados ob-
tenidos de la encuesta se generalizan a toda la poblacin, a su vez es trietpico, estraticado y por conglomerados,
donde la unidad ltima de seleccin es la persona que al momento de la entrevista tenga seis aos cumplidos o ms.
El marco de muestreo empleado es el Marco Nacional de Viviendas 2012 del INEGI, construido a partir de la
informacin cartogrca y demogrca que se obtuvo del Censo de Poblacin y Vivienda 2010. Este marco es en
realidad una muestra maestra de la que a su vez se seleccionan las muestras para todas las encuestas en viviendas
que realiza el INEGI; como tal, su diseo es probabilstico, estraticado, unietpico y por conglomerados, a los que
se denomin unidades primarias de muestreo, pues es en stas donde se seleccionan, en una segunda etapa, las
viviendas que integran las muestras de las diferentes encuestas.
Las unidades primarias de muestreo estn constituidas por agrupaciones de viviendas con caractersticas diferencia-
das dependiendo del mbito al que pertenecen, como se especica a continuacin:
a) En urbano alto
El tamao mnimo de una UPM es de 80 viviendas habitadas y el mximo es de 160. Pueden estar formadas por:
Una manzana.
La unin de dos o ms manzanas contiguas del mismo AGEB1.
La unin de dos o ms manzanas contiguas de diferentes AGEB de la misma localidad.
La unin de dos o ms manzanas contiguas de diferentes localidades pero del mismo tamao de localidad.
b) En complemento urbano
El tamao mnimo de una UPM es de 160 viviendas habitadas y el mximo es de 300. Pueden estar formadas por:
Una manzana.
La unin de dos o ms manzanas contiguas de la misma AGEB.
c) En rural
El tamao mnimo de una UPM es de 160 viviendas habitadas y el mximo es de 300. Pueden estar formadas por:
Una localidad.
La unin de dos o ms localidades cercanas del mismo municipio.
1
rea Geoestadstica Bsica.
1
4.2 Estraticacin
La divisin poltica del pas y la conformacin de localidades diferenciadas por su tamao, forman de manera natural
una primera estraticacin geogrca.
En cada entidad federativa, se distinguen tres mbitos, divididos a su vez en zonas, como se indica en el siguiente
cuadro:
De manera paralela, en una segunda etapa se formaron cuatro estratos en los que se agruparon todas las UPM
del pas, esta estraticacin considera las caractersticas sociodemogrcas de los habitantes de las viviendas, as
como, las caractersticas fsicas y el equipamiento de las mismas, expresadas por medio de 34 indicadores* cons-
truidos con informacin del Censo de Poblacin y Vivienda 2010, para lo cual se emplearon mtodos estadsticos
multivariados.
En una tercera etapa, cada UPM fue asignada a su estrato geogrco entidad-mbito-zona.
5. Tamao de la muestra
Para el clculo del tamao de muestra de la ENDUTIH-2016 se emple la siguiente expresin:
z 2 q DEFF
n
r 2 p 1 - tnr PHV
Donde:
n =
tamao de la muestra.
p =
estimacin de la proporcin de inters.
q =
1-p.
r =
error relativo mximo aceptable.
z =
valor asentado en las tablas estadsticas, de la distribucin normal estndar, que garantiza realizar las
estimaciones con una conanza prejada.
DEFF = efecto de diseo denido como el cociente de la varianza en la estimacin del diseo utilizado, entre
la varianza obtenida considerando un muestreo aleatorio simple para un mismo tamao de muestra.
tnr = tasa de No respuesta mxima esperada.
PVH = promedio de hogares por vivienda.
A nivel nacional se obtuvo una muestra total de 134 079 que permite estimar proporciones de 1% para un nivel
de conanza del 90%, un efecto de diseo de 2.57 observado en experiencias anteriores, un error relativo mximo
esperado de 7.77%, una tasa de No respuesta de 15%, un promedio de hogares por vivienda de 1.002.
Para el agregado de las 49 ciudades de inters, se obtuvo una muestra de 103 000 viviendas, de las cuales se
tomaron 2 000 viviendas en 46 de ellas y una sobremuestra en los casos de Ciudad de Mxico, Guadalajara y
Monterrey, las cuales permiten estimar a nivel ciudad proporciones del 11% para un nivel de conanza del 90%, un
efecto de diseo de 1.60 observado en experiencias anteriores, un error relativo mximo de 14.34, una tasa de No
respuesta de 15% y un promedio de hogares por viviendas de 1.002.
* La descripcin de estos indicadores se presenta en el cuadro 1.
2
6. Ajacin de la muestra
La ajacin de la muestra se realiz dentro de cada entidad federativa entre los diferentes estratos de manera pro-
porcional a su tamao, para lo cual se emple la siguiente expresin:
Neh
neh ne
Ne
Donde:
INEGI. Encuesta Nacional sobre Disponibilidad y Uso de Tecnologas de la Informacin en los Hogares 2016. ENDUTIH. Diseo muestral. 2017
ne = nmero total de viviendas en muestra, en la e-sima entidad.
En los cuadros 2 y 3 se presenta la distribucin de la muestra en viviendas para la ENDUTIH-2016 en las 49 ciu-
dades de inters y en las 32 entidades respectivamente.
7. Seleccin de la muestra
La seleccin de la muestra, se realiz de manera independiente por entidad, dominio y estrato, el procedimiento de
seleccin vari de acuerdo con el dominio.
1. Se seleccionaron Keh UPM, con probabilidad proporcional al nmero de viviendas del estrato.
2. En cada UPM seleccionada, se seleccionaron cinco viviendas con igual probabilidad.
3. En cada vivienda seleccionada se seleccion una persona de seis aos cumplidos o ms.
Por lo tanto, la probabilidad de seleccionar una persona de la j-sima vivienda, de la i-sima UPM, del h-simo
estrato, de la e-sima entidad, se dene de la siguiente manera:
k eh mehi 5 1 5 k eh mehi
PVehij
meh mehi Q ehij meh m*ehiQ ehij
*
keh = nmero de UPM seleccionadas en el h-simo estrato, en la e-sima entidad, para el marco de la muestra
maestra.
mehi = nmero de viviendas en la i-sima UPM, en el h-simo estrato, en la e-sima entidad, segn Censo de
Poblacin y Vivienda 2010.
mehi = nmero de viviendas en la i-sima UPM, en el h-simo estrato, en la e-sima entidad, segn listado de
viviendas actualizado.
Qehij = nmero de personas de seis aos cumplidos o ms en la j-sima vivienda, en la i-sima UPM, en el h-simo
estrato, en la e-sima entidad.
2
El factor de expansin se dene como el inverso de la probabilidad de seleccin.
3
7.2 En complemento urbano
Por lo tanto, la probabilidad de seleccionar una persona de la j-sima vivienda, de la i-sima UPM, del
h-simo estrato, de la e-sima entidad, se dene de la siguiente manera:
k eh mehi 20 1 20 k eh mehi
PVehij
meh mehi Q ehij meh m*ehiQ ehij
*
INEGI. Encuesta Nacional sobre Disponibilidad y Uso de Tecnologas de la Informacin en los Hogares 2016. ENDUTIH. Diseo muestral. 2017
keh = nmero de UPM seleccionadas en el h-simo estrato, en la e-sima entidad para el marco de la muestra
maestra.
mehi = nmero de viviendas en la i-sima UPM, en el h-simo estrato, en la e-sima entidad, segn Censo de
Poblacin y Vivienda 2010.
m*chi = nmero de viviendas en la i-sima UPM, en el h-simo estrato, en la e-sima entidad, segn listado de
viviendas actualizado.
Qehij = nmero de personas de seis aos cumplidos o ms en la j-sima vivienda, en la i-sima UPM, en el h-simo
estrato, en la e-sima entidad.
7.3 En rural
1. Se seleccionaron Keh UPM con probabilidad proporcional al total de viviendas del estrato.
2. En cada UPM seleccionada, se seleccionaron cuatro segmentos de cinco viviendas aproximadamente con igual
probabilidad.
3. En cada vivienda seleccionada se seleccion una persona de seis aos cumplidos o ms.
Por lo tanto, la probabilidad de seleccionar una persona de la j-sima vivienda, de la i-sima UPM, del h-simo
estrato, de la e-sima entidad, se dene de la siguiente manera:
mehi = nmero de viviendas en la i-sima UPM, en el h-simo estrato, en la e-sima entidad, segn Censo de
Poblacin y Vivienda 2010
m*chi = nmero de viviendas en la i-sima UPM, en el h-simo estrato, en la e-sima entidad, segn listado de
viviendas actualizado.
4
Qehij = nmero de personas de seis aos cumplidos o ms en la j-sima vivienda, en la i-sima UPM, en el h-simo
estrato, en la e-sima entidad.
El ajuste por No respuesta, atribuida al informante, se realiza a nivel estrato, en cada uno de los dominios, me-
INEGI. Encuesta Nacional sobre Disponibilidad y Uso de Tecnologas de la Informacin en los Hogares 2016. ENDUTIH. Diseo muestral. 2017
diante la siguiente expresin:
' nvhch
Fchij Fchij
nvhcR ch
Donde:
Fchij = factor de expansin corregido por No respuesta de la j-sima vivienda, de la i-sima UPM, del h-simo
estrato, de la c-sima ciudad.
Fchij = factor de expansin corregido por No respuesta de la j-sima vivienda, de la i-sima UPM, del h-simo
estrato, de la c-sima ciudad a nivel entidad.
nvhcRch = nmero de viviendas seleccionadas habitadas con respuesta en el h-simo estrato, en la c-sima
ciudad.
Los factores de expansin ajustados por la No respuesta se corrigen, a n de asegurar que en cada dominio de
inters de la encuesta se obtenga la poblacin total determinada por la proyeccin de poblacin generada por INEGI
referida al punto medio del levantamiento, mediante la siguiente expresin:
PROy D
FD'' FD'
PEXPD
Donde:
9. Estimadores
UA
X Fehij X Uehis
A FCU
ehij
X Cehis
U
R
Fehij X Rehis
e h i s e h i s e h i s
5
Donde:
Fehij
UA
= factor de expansin nal de la j-sima vivienda, de la i-sima UPM, del h-simo estrato, de la e-sima
entidad en el dominio urbano alto.
X Uehis
A
= valor observado de la caracterstica de inters X en la l-sima persona, en la s-sima vivienda, en la
i-sima UPM, en el h-simo estrato, en la e-sima entidad, en el dominio urbano alto.
Fehij
C
U
= factor de expansin nal de la j-sima vivienda, de la i-sima UPM, del h-simo estrato, de la e-sima
entidad, en el dominio complemento urbano.
X Cehis
U
= valor observado de la caracterstica de inters X en la l-sima persona, en la s-sima vivienda, en la
INEGI. Encuesta Nacional sobre Disponibilidad y Uso de Tecnologas de la Informacin en los Hogares 2016. ENDUTIH. Diseo muestral. 2017
i-sima UPM, en el h-simo estrato, en la e-sima entidad, en el dominio complemento urbano.
Fehij
R
= factor de expansin nal de la j-sima vivienda, de la i-sima UPM, del h-simo estrato, de la e-sima
entidad del dominio rural.
Para obtener los errores de muestreo de los estimadores de razn, conjuntamente al mtodo de Conglomerados
ltimos se aplic el mtodo de series de Taylor, obtenindose la siguiente frmula para estimar la precisin de R :
L c
2
V R
1 32 k ch k ch 1 1
X chi X ch R Y chi Y ch
Y 2 c h k ch 1 i k ch k ch
Donde:
X chi = total ponderado de la variable de estudio X en la i-sima UPM, en el h-simo estrato, en la c-sima ciudad.
2
32 Lc k ch
k ch
1
V X NAL X chi - X ch
c 1 h1 k ch - 1 i 1 k ch
3
Vase Hansen, M. H. Horwitz, W.N. y Madow, W.G., Sample Survey Methods and Theory, (1953) Vol. 1 pg. 242.
6
Las estimaciones de la desviacin estndar (D.E.), efecto de diseo (DEFF) y coeciente de variacin (C.V.) se
calculan mediante las siguientes expresiones:
V V
D.E. V C.V. DEFF
V MAS
Donde:
INEGI. Encuesta Nacional sobre Disponibilidad y Uso de Tecnologas de la Informacin en los Hogares 2016. ENDUTIH. Diseo muestral. 2017
V MAS = estimador de la varianza bajo muestreo aleatorio simple.
I1- - Z
V , Z
V
1- 1-
2 2
7
Anexo
INEGI. Encuesta Nacional sobre Disponibilidad y Uso de Tecnologas de la Informacin en los Hogares 2016. ENDUTIH. Diseo muestral. 2017
$,QGLFDGRUHVHPSOHDGRVHQODHVWUDWLILFDFLyQGHOPDUFRGHODPXHVWUDPDHVWUD
0QHPyQLFR 'HVFULSFLyQ
3URSRUFLyQGH3REODFLyQ
4XHWLHQHGHUHFKRDUHFLELUVHUYLFLRVPpGLFRVHQDOJXQDLQVWLWXFLyQGHVDOXGS~EOLFDRSULYDGD
33661263
H[FHSWRVHJXURSRSXODU
33'(5B66 'HUHFKRKDELHQWHDVHUYLFLRVGHVDOXG
3'3$$ 'HDDxRVGHHGDGTXHDVLVWHDODHVFXHOD
3'3$$ 'HDDxRVGHHGDGTXHDVLVWHDODHVFXHOD
3'3$$/) 'HDDxRVGHHGDGTXHVDEHQOHHURHVFULELU
INEGI. Encuesta Nacional sobre Disponibilidad y Uso de Tecnologas de la Informacin en los Hogares 2016. ENDUTIH. Diseo muestral. 2017
'HDxRVRPiVGHHGDGTXHDSUREDURQDOJ~QJUDGRGHHVFRODULGDGGLIHUHQWHDOQLYHO
3'3<0B6(
SUHHVFRODU
'HDxRVRPiVGHHGDGTXHWLHQHQFRPRPi[LPDHVFRODULGDGJUDGRVDSUREDGRVHQ
3335,B&2
SULPDULD
'HDxRVRPiVGHHGDGTXHWLHQHQFRPRPi[LPDHVFRODULGDGJUDGRVDSUREDGRVHQ
336(&B&2
VHFXQGDULD
3*'2B(6& *UDGRSURPHGLRGHHVFRODULGDG
'HDxRV\PiVTXHWUDEDMDURQWHQtDQWUDEDMRSHURQRWUDEDMDURQREXVFDURQWUDEDMRHQOD
33($
VHPDQDGHUHIHUHQFLD
)HPHQLQDGHDxRV\PiVTXHWUDEDMDURQWHQtDQWUDEDMRSHURQRWUDEDMDURQREXVFDURQ
33($B)
WUDEDMRHQODVHPDQDGHUHIHUHQFLD
37$6$2&83$ 7DVDGHRFXSDFLyQ
72&8$ 1RRFXSDGDGHDDxRVGHHGDGHQWUHODSREODFLyQGHDDxRVGHHGDG
3320$<(' 2FXSDGDGH\PiVDxRVGHHGDGHQWUHODSREODFLyQRFXSDGD
3URSRUFLyQGH9LYLHQGDV3DUWLFXODUHV+DELWDGDV
39,96,1+ 4XHQRWLHQHQKDFLQDPLHQWR
393+B3,6'7 4XHWLHQHQSLVRGHFHPHQWRRILUPHPDGHUDPRVDLFRXRWURPDWHULDO
393+<0$6' 4XHXVDQSDUDGRUPLUHQWUH\FXDUWRV
393+B0$6& 4XHWLHQHQPiVGHXQFXDUWR
393+<0$6& 4XHWLHQHQHQWUH\FXDUWRV
393+B&B(/( 4XHGLVSRQHQGHOX]HOpFWULFD
4XHWLHQHQGLVSRQLELOLGDGGHDJXDHQWXEDGDGHQWURGHODYLYLHQGDRIXHUDGHODYLYLHQGDSHUR
393+$*8$'9
GHQWURGHOWHUUHQR
393+B(;&6$ 4XHWLHQHQH[FXVDGRUHWUHWHVDQLWDULROHWULQDXKR\RQHJUR
393+'5(1$- 4XHWLHQHQGUHQDMHFRQHFWDGRDODUHGS~EOLFDIRVDVpSWLFDEDUUDQFDJULHWDULRODJRRPDU
39'5(5(' 4XHGLVSRQHQGHGUHQDMHFRQHFWDGRDODUHGS~EOLFD
39(;&$*8 4XHGLVSRQHQGHH[FXVDGRFRQGHVFDUJDGLUHFWDGHDJXD
4XHGLVSRQHQGHOX]HOpFWULFDDJXDHQWXEDGDGHQWURRIXHUDGHODYLYLHQGDSHURGHQWURGHO
393+B&6(59
WHUUHQRDVtFRPRGUHQDMH
36,1B+$6,1 4XHQRVHHQFXHQWUDQHQVLWXDFLyQGHKDFLQDPLHQWRDQLYHOPDQ]DQD
3URSRUFLyQGH9LYLHQGDV3DUWLFXODUHV+DELWDGDVTXHGLVSRQHQGH
393+B79 7HOHYLVRU
393+B$8720 $XWRPyYLORFDPLRQHWD
393+B&(/ 7HOpIRQRFHOXODU
39&(/),- 7HOpIRQRFHOXODU\WHOpIRQRILMR
39(/(& 5DGLRWHOHYLVRUUHIULJHUDGRU\ODYDGRUD
395$'7(/ 5DGLR\WHOHYLVRU
393+&%,(1 7RGRVORVELHQHV
11
%'LVWULEXFLyQGHODPXHVWUDHQYLYLHQGDVSDUDOD(1'87,+DQLYHOHQWLGDG
&ODYH (QWLGDG 0XHVWUD
$JXDVFDOLHQWHV
%DMD&DOLIRUQLD
%DMD&DOLIRUQLD6XU
&DPSHFKH
&RDKXLODGH=DUDJR]D
&ROLPD
INEGI. Encuesta Nacional sobre Disponibilidad y Uso de Tecnologas de la Informacin en los Hogares 2016. ENDUTIH. Diseo muestral. 2017
12
&'LVWULEXFLyQGHODPXHVWUDHQYLYLHQGDVSDUDOD(1'87,+DQLYHOFLXGDGGHLQWHUpV
&ODYH &LXGDG 0XHVWUD
$JXDVFDOLHQWHV
7LMXDQD
0H[LFDOL
(QVHQDGD
/D3D]
&DPSHFKH
6DOWLOOR
7RUUHyQ*yPH]3DODFLR
&ROLPD
INEGI. Encuesta Nacional sobre Disponibilidad y Uso de Tecnologas de la Informacin en los Hogares 2016. ENDUTIH. Diseo muestral. 2017
7X[WOD*XWLpUUH]
7DSDFKXOD
&KLKXDKXD
&G-XiUH]
&LXGDGGH0p[LFR
'XUDQJR
/HyQ
,UDSXDWR
&HOD\D
$FDSXOFR
&KLOSDQFLQJR
3DFKXFD
*XDGDODMDUD
7ROXFD
0RUHOLD
8UXDSDQ
&XHUQDYDFD
7HSLF
0RQWHUUH\
2D[DFD
3XHEOD
7HKXDFiQ
4XHUpWDUR
&DQF~Q
6DQ/XLV3RWRVt
&XOLDFiQ5RVDOHV
0D]DWOiQ
+HUPRVLOOR
&LXGDG2EUHJyQ
9LOODKHUPRVD
7DPSLFR
5H\QRVD
0DWDPRURV
1XHYR/DUHGR
7OD[FDOD
9HUDFUX]
;DODSD
&RDW]DFRDOFRV
0pULGD
=DFDWHFDV
7RWDO
13