Professional Documents
Culture Documents
CURSO-TALLER
TECNICAS DE DISEO Y DESARROLLO DE
ENCUENTAS
MUESTREO
Octubre de 2009
Muestreo
TABLA DE CONTENIDO
1.
CONCEPTOS GENERALES...............................................................................3
1.1 LOS DATOS, LA INFORMACIN Y LA INFORMACIN ESTADSTICA.........3
1.2 ALTERNATIVAS PARA LA CONSECUCIN DE DATOS. CENSOS,
ENCUESTAS Y REGISTROS......................................................................3
1.2.1 El censo...................................................................................................3
1.2.2 La encuesta por muestreo........................................................................3
1.2.3 Los registros. El uso de informacin secundaria......................................3
1.3 LA ENCUESTA POR MUESTREO..................................................................3
1.3.1 Componentes de una encuesta por muestreo..........................................3
1.4 EL MUESTREO. GENERALIDADES..............................................................3
1.4.1 Muestreo probabilstico............................................................................3
1.4.2 Muestreo no probabilstico.......................................................................3
1.4.3 Formulacin de un plan muestral.............................................................3
1.4.4 La poblacin objetivo y la poblacin observable.......................................3
1.4.5 El Marco de muestreo y la informacin auxiliar........................................3
1.4.6 Imperfecciones del Marco de muestreo....................................................3
1.4.7 El tamao de muestra..............................................................................3
2.
3.
4.
MUESTREO ESTRATIFICADO...........................................................................3
4.1 Cantidad de estratos y delimitacin.................................................................3
4.1.1 Mtodo Raz cum de f (Dalenius y Hodges).............................................3
4.2 Asignacin del tamao de muestra..................................................................3
4.2.1 Asignacin proporcional...........................................................................3
4.2.2 Asignacin de Neyman.............................................................................3
4.2.3 Asignacin X-proporcional........................................................................3
4.2.4 Asignacin de potencia............................................................................3
5.
Muestreo
PROCEDIMIENTOS DE ESTIMACIN..............................................................3
6.1 Principios generales del proceso de estimacin..............................................3
6.2 Estimacin de algunos parmetros frecuentes................................................3
6.2.1 Totales.......................................................................................................3
6.2.2 Promedios.................................................................................................3
6.2.3 Proporciones.............................................................................................3
6.2.4 Razones....................................................................................................3
6.3 Estimacin en diseos estratificados, de conglomerados y multietpicos.......3
6.4 Estimacin de dominios de estudio..................................................................3
6.5 Ajuste de factores de expansin......................................................................3
6.6 Otros mtodos de estimacin..........................................................................3
7.
8.
BIBLIOGRAFIA.......................................................................................................... 3
Muestreo
1. CONCEPTOS GENERALES
1.1.
LOS DATOS,
ESTADSTICA
LA
INFORMACIN
LA
INFORMACIN
ENCUESTAS Y REGISTROS
Frente a la necesidad de obtener informacin sobre un tema especfico,
es posible emprender un proceso de recoleccin de datos o utilizar datos
que ya hayan sido recogidos y estn disponibles para su uso; en el
primer caso puede llevarse a cabo un censo o una encuesta y en el
segundo, puede hacerse uso de registros.
1.2.1 El censo
Es la recoleccin de datos para todas las unidades que
conforman la poblacin de inters.
Ejemplos:
Muestreo
Ventajas:
Desventajas:
Muestreo
Ventajas:
Muestreo
Desventajas:
Salvo que hayan sido planeadas de antemano, en general no
es posible hacer desagregaciones precisas de informacin
para pequeos grupos poblacionales, reas pequeas o
clasificaciones exhaustivas.
Muestreo
Ventajas:
Desventajas:
Muestreo
1.3.
Muestreo 10
Ejemplos:
1. Encuesta de ingresos y gastos.
Propsito: Producir informacin peridica de las caractersticas de las
viviendas, hogares y personas y de las estructuras de ingreso y gasto
de los hogares.
Unidad de muestreo: Hogares particulares que residen en una unidad
de vivienda.
Unidades de anlisis: Dependiendo del tipo de informacin que se
analice, viviendas, hogares, miembros del hogar, perceptores de
ingreso, entre otras.
Unidad Informante: Para las caractersticas de vivienda, hogar y
persona, miembros del hogar, mayores de 18 aos y parientes del
jefe de hogar. Para las variables de ingreso y gasto, jefe del hogar.
Unidad de referencia: Dependiendo de las variables que se indaguen
corresponde a la unidad de vivienda, el hogar, o miembro del hogar.
Para lo correspondiente a gastos, la unidad de gasto .
1.3.1 Componentes de una encuesta por muestreo
Muestreo 11
Muestreo 12
1.4.
EL MUESTREO. GENERALIDADES
El muestreo es un conjunto de tcnicas que permite elegir una porcin de
elementos de la poblacin objetivo, denominada muestra, para su
estudio.
Entre varias alternativas para la seleccin de los elementos a encuestar,
se prefiere aquella que:
1.
2.
3.
Muestreo 13
Desventajas
Desventajas
Muestreo 14
Muestreo 15
Muestreo 16
Muestreo 17
Muestreo 18
Muestreo 19
Muestreo 20
Muestreo 21
NZ 2 2
Z 2 2 NE 2
Donde:
Muestreo 22
Muestreo 23
Muestreo 24
n
de ser incluido en alguna muestra, con n el tamao
N
Muestreo 25
Finca
1
LA LIBERTAD
2
EL REFUGIO
3
LA CASONA
4
AMANECER
5
YERBABUENA
6
ASTAIZA
Para seleccionar una muestra con MAS:
1. Genere un nmero aleatorio con distribucin uniforme en el intervalo
(0,1) para cada una de las fincas existentes en el marco
2. Ordene las fincas del marco en forma descendente con respecto al
nmero aleatorio generado.
3. La muestra est conformada por las 4 primeras en el ordenamiento
por este criterio
Tabla 2. Ejemplo MAS. Seleccin de muestra
No.
6
1
3
5
2
4
Finca
ASTAIZA
LA LIBERTAD
LA CASONA
YERBABUENA
EL REFUGIO
AMANECER
Aleatorio
0,96950958
0,79594428
0,76140399
0,72174676
0,67143972
0,0666237
Ventajas:
Muestreo 26
Desventajas:
Muestreo 27
LA LIBERTAD
Gasto anual en
semillas
26.000
EL REFUGIO
470.000
LA CASONA
63.800
AMANECER
145.000
YERBABUENA
230.000
ASTAIZA
12.500
No.
Finca
Muestreo 28
Tamao 2
Promedio
Muestra
estimado
Tamao 3
Tamao 4
Promedio
Promedio
Promedio
Muestra
Muestra
estimado
estimado
estimado
Tamao 5
Muestra
Promedio
estimado
Tamao 6
Muestra
26.000
1,2
248.000
1,2,3
186.600
1,2,3,4
176.200
1,2,3,4,5
186.960 1,2,3,4,5,6
470.000
1,3
44.900
1,2,4
213.667
1,2,3,5
197.450
1,2,3,4,6
143.460
63.800
1,4
85.500
1,2,5
242.000
1,2,3,6
143.075
1,2,3,5,6
160.460
Promedio
estimado
157.883
Muestreo 29
145.000
1,5
128.000
1,2,6
169.500
1,2,4,5
217.750
1,2,4,5,6
230.000
12.500
1,6
19.250
2,3
266.900
2,4
307.500
2,5
350.000
2,6
1,3,4
78.267
1,2,4,6
127.125
1,3,4,5,6
95.460
1,3,5
106.600
1,2,5,6
184.625
2,3,4,5,6
184.260
1,3,6
34.100
1,3,4,5
116.200
1,4,5
133.667
1,3,4,6
61.825
241.250
1,4,6
61.167
1,3,5,6
83.075
3,4
104.400
1,5,6
89.500
1,4,5,6
103.375
3,5
146.900
2,3,4
226.267
2,3,4,5
227.200
3,6
38.150
2,3,5
254.600
2,3,4,6
172.825
4,5
187.500
2,3,6
182.100
2,3,5,6
194.075
4,6
78.750
2,4,5
281.667
2,4,5,6
214.375
5,6
121.250
2,4,6
209.167
3,4,5,6
112.825
2,5,6
237.500
3,4,5
125.000
3,4,6
73.767
3,5,6
102.100
4,5,6
129.167
176.700
VP. typ
VMAS ty
Muestreo 30
2.2.
MUESTREO SISTEMTICO
Consiste en la seleccin de unidades partiendo de un marco de lista
numerado, seleccionando en forma aleatoria la primera unidad a ser
incluida en la muestra y de ah en adelante saltando con un intervalo de
seleccin K; si la primera unidad seleccionada es la j-sima, la muestra
estar compuesta por los elementos {j, j+k, j+2k, }. Una vez que la
primera unidad ha sido seleccionada ya est determinada toda la
muestra; solamente existen k posibles muestras.
Ejemplo
Suponga una poblacin objetivo compuesta por 70 fincas de las cuales
se desea seleccionar una muestra de tamao n = 10 utilizando un diseo
sistemtico.
Para seleccionar la muestra con este diseo, se siguen los siguientes
pasos:
1. Determine el intervalo de seleccin:
k
N 70
7
n 10
2
2
9
16
23
30
37
44
51
58
arranque aleatorio
3
4
5
3
4
5
10
11
12
17
18
19
24
25
26
31
32
33
38
39
40
45
46
47
52
53
54
59
60
61
6
6
13
20
27
34
41
48
55
62
7
7
14
21
28
35
42
49
56
63
Muestreo 31
64
65
66
67
68
69
70
Ventajas:
Desventajas:
1
31
23
40
43
32
2
40
64
43
69
65
arranque aleatorio
3
4
5
90
102
110
88
60
117
45
58
126
53
60
87
80
81
93
6
79
74
125
109
109
7
156
148
155
101
90
Muestreo 32
30
23
46
49
34
54
66
45
67
46
52
42
56
89
64
109
81
82
51
69
71
72
126
129
124
132
142
93
96
117
140
121
145
112
124
Promedio
muestra
35,1
55,9
65,9
75,3
105,5
107,6
129,2
Promedio real
82,1
82,1
82,1
82,1
82,1
82,1
82,1
N
r y se
n
Para ambos
Muestreo 33
2
2
16
30
44
58
3
3
17
31
45
59
4
4
18
32
46
60
arranque aleatorio
6
7
8
9
6
7
8
9
20
21
22
23
34
35
36
37
48
49
50
51
62
63
64
65
5
5
19
33
47
61
10
10
24
38
52
66
11
11
25
39
53
67
12
12
26
40
54
68
13
13
27
41
55
69
14
14
28
42
56
70
N
k 11.7 y las posibles muestras tienen
n
2
2
13
24
35
46
57
68
3
3
14
25
36
47
58
69
4
4
15
26
37
48
59
70
arranque aleatorio
5
6
7
5
6
7
16
17
18
27
28
29
38
39
40
49
50
51
60
61
62
8
8
19
30
41
52
63
9
9
20
31
42
53
64
10
10
21
32
43
54
65
11
11
22
33
44
55
66
Muestreo 34
N
y para la seleccin, se eligen
n
Muestreo 35
Muestreo 36
respecto al promedio, la diferencia entre las muestras que la incluyen y las que
no generara una dispersin y consecuentemente una falta de precisin en los
estimadores que no es deseable. Como su nombre lo indica, con los mtodos
proporcionales al tamao un elemento tiene mayor probabilidad cuanto mayor
es su tamao con relacin a la variable utilizada en el diseo.
Existen dos diseos que usan esta proporcionalidad: El PPT que es con
reemplazamiento y el PT que es sin reemplazamiento. El primero es
ampliamente utilizado porque es eficiente y las tareas de seleccin de muestra
y estimacin son sencillas de implementar. El segundo, aunque es ms
eficiente utilizando la misma informacin auxiliar, es menos utilizado porque
requiere de algoritmos especiales para la seleccin de muestra y la estimacin
de varianza es demasiado compleja.
Es importante aclarar que el mtodo es ms eficiente que un diseo que no
involucre informacin adicional (MAS, sistemtico) cuando la informacin
auxiliar es proporcional a las caractersticas de inters que se estudiarn en la
encuesta, y aumenta en eficiencia en la medida en que la relacin de
proporcionalidad sea ms fuerte. Sin embargo, an con asociaciones que
podran considerarse dbiles para la formulacin de modelos de prediccin se
obtienen buenos resultados en comparacin con un MAS. En este mismo
sentido, la validez de los resultados no se compromete si la relacin no es tan
fuerte.
Para la generacin de estimaciones, es importante resaltar que como no la
probabilidad de que una unidad sea incluida en la muestra cambia de unidad en
unidad, es necesario considerar esta probabilidad en los clculos. Si se
suponen probabilidades iguales y se utilizan procedimientos como los del MAS,
los estimadores se sesgan y no apuntan al verdadero valor del parmetro.
Grfico 9. Esquema grfico de los diseos Proporcionales al Tamao
Muestreo 37
3.1
Finca
Hectreas
Pi
Lmite inferior
Lmite superior
LA LIBERTAD
52
0,050731707
0,050731707
EL REFUGIO
48
0,046829268
0,050731708
0,097560976
Aleatorio
Muestreo 38
Rango
No.
Finca
Hectreas
Pi
Lmite inferior
Lmite superior
Aleatorio
LA CASONA
25
0,024390244
0,097560977
0,12195122
AMANECER
264
0,257560976
0,121951221
0,379512195
YERBABUENA
15
0,014634146
0,379512196
0,394146341
ASTAIZA
350
0,341463415
0,394146342
0,735609756
0,473455993
EL PORVENIR
82
0,08
0,735609757
0,815609756
0,812752937
LA MAGOLA
65
0,063414634
0,815609757
0,87902439
0,8544273
EL PARAISO
78
0,076097561
0,879024391
0,955121951
10
EL REMANSO
46
0,044878049
0,955121952
1.025
TOTAL
0,150034876
x
i 1
1025
256
4
Muestreo 39
Intervalo
No.
Finca
Hectreas
Hectreas
acumulado
Lmite inferior
Lmite superior
LA LIBERTAD
52
52
52
EL REFUGIO
48
100
53
100
LA CASONA
25
125
101
125
AMANECER
264
389
126
389
YERBABUENA
15
404
390
404
ASTAIZA
350
754
405
754
EL PORVENIR
82
836
755
836
LA MAGOLA
65
901
837
901
EL PARAISO
78
979
902
979
10
EL REMANSO
46
1.025
980
1.025
TOTAL
Unidades
seleccionadas
1) 196
2) 452 3) 708
4) 964
1.025
Como puede verse, en este ejemplo la finca ASTAIZA, que tiene un gran
tamao en comparacin con las dems result seleccionada dos veces, con el
nmero 452 y el 708. Esto puede suceder porque el diseo es con
reemplazamiento; tambin en una seleccin con el Mtodo Acumulativo Total se
presenta cuando dos o ms de los nmeros aleatorios generados caen dentro
del intervalo de una misma unidad.
Muestreo 40
4.
MUESTREO ESTRATIFICADO
Muestreo 41
Ventajas
Desventajas
PPT
Sistemtico
Muestreo 42
Muestreo 43
Muestreo 44
Cantidad de
fincas
Menos de 10
De 10 a 20
Amplitud
intervalo
Raz fi
Raz u
Acumulado
Raiz fi *Raz u
442
10
21.02
21.02
299
10
17.29
38.32
De 20 a 30
137
10
11.70
50.02
De 30 a 40
40
10
6.32
56.34
De 40 a 50
28
10
5.29
61.64
De 50 a 60
20
10
4.47
66.11
De 60 a 70
10
2.45
68.56
De 70 a 80
10
2.24
70.79
De 80 a 90
10
1.73
72.53
De 90 a 100
10
2.45
74.98
De 100 a 150
50
3.00
2.24
81.68
fi
De 150 a 200
50
2.45
2.24
87.16
De 200 a 500
12
300
3.46
5.48
106.13
De 500 a 1000
500
2.24
7.07
121.95
Lmtes
30.48
60.97
91.45
4.2
Tamao (Ha)
Cantidad
de fincas
Menos de 20
De 20 a 50
De 50 a 200
Ms de 200
741
205
55
17
fi
que
n
h 1
n.
Muestreo 45
N
Cantidad de unidades en el estrato h
n h
Cantidad de unidades en la poblacin
N
nh n
Nh Sh
L
N
h 1
Sh
Muestreo 46
nh n
x
i 1
N
hi
x
i 1
nh n
(t xh ) a CV xh
L
(t
h 1
xh
) a CV xh
S xh
xh
Muestreo 47
Poblacin
Nh
BOGOTA
6,740,859
ANDINA
16,597,681
CARIBE
8,880,986
PACIFICO
7,083,712
LLANOS
1,571,104
AMAZONICA
300,511
N
41,174,853
Sxh
0.0385
0.0396
0.0340
0.0242
0.0610
0.0547
CVxh
2.1000
2.4000
1.8000
1.6000
2.7000
2.5000
Asignacin
Proporcio
nal
Asignacin
de Neyman
con X
Asignacin
X-Proporcio
nal
Asignacin
de potencia
a=1/2
1,637
4,031
2,157
1,720
382
73
10,000
1,728
4,374
2,010
1,141
638
109
10,000
1,731
3,832
2,348
1,500
497
92
10,000
1,862
3,166
1,858
1,321
1,282
511
10,000
Zona
Poblacin
Nh
Nacidos vivos
2007
ty
Syh
Asignacin
Proporcional
Asignacin
de Neyman
con X
Asignacin
Asignacin
Xde potencia
Proporcional
a=1/2
Muestreo 48
BOGOTA
ANDINA
CARIBE
PACIFICO
LLANOS
AMAZONICA
N
6,740,859
16,597,681
8,880,986
7,083,712
1,571,104
300,511
41,174,853
126,729
261,211
131,863
101,274
34,604
4,709
660,390
0.0385
0.0396
0.0340
0.0242
0.0610
0.0547
5.1%
4.0%
4.9%
4.1%
14.2%
40.9%
2.32%
4.9%
3.8%
5.1%
5.0%
11.0%
33.4%
2.27%
4.9%
4.1%
4.7%
4.4%
12.4%
36.4%
2.30%
4.7%
4.5%
5.3%
4.7%
7.7%
15.4%
2.40%
Muestreo 49
5.
5.1
MUESTREO DE CONGLOMERADOS
Consiste en la divisin de la poblacin objetivo en grupos, tambin
denominados conglomerados o clusters, disyuntos entre s, y la seleccin
de una muestra de grupos para representar al total de la poblacin,
utilizando un diseo de muestreo como los mencionados. Todas las
unidades que pertenecen a los conglomerados seleccionados, se
consideran seleccionadas y no pertenecen a la muestra unidades de
conglomerados que no han sido seleccionados; en este sentido, difiere
del muestreo estratificado en el que se lleva a cabo una seleccin en
todos los grupos (estratos) y solo pertenecen a la muestra algunas
unidades de cada estrato.
En general, los grupos que se utilizan para el muestreo de
conglomerados son agrupaciones naturales de la poblacin, como los
estudiantes de un curso, las viviendas de un rea geogrfica
determinada o las personas que pertenecen a un hogar. Tambin es
Muestreo 50
Muestreo 51
Ventajas
Desventajas
Muestreo 52
Muestreo 53
5.2
MUESTREO MULTIETPICO
El muestreo multietpico est relacionado con el muestreo de
conglomerados en el sentido de seleccionar grupos de unidades en una
primera instancia; sin embargo, en el multietpico no se entrevista a
todas las unidades que conforman el grupo sino que se selecciona una
muestra de unidades en cada uno de los grupos seleccionados. Es
posible seleccionar muestras en dos, tres o ms etapas.
Ejemplo
En un estudio nacional urbano sobre las caractersticas de los hogares
que tienen personas residentes en el exterior, se selecciona una muestra
en tres etapas as:
1. Sobre un listado de distritos del pas, se selecciona una muestra
2. En cada uno de los distritos seleccionados se identifica el listado de
manzanas que compone el rea urbana
3. Se lleva a cabo una seleccin de manzanas en cada distrito
seleccionado
4. En cada manzana seleccionada se construye un listado de los
hogares residentes
5. Se selecciona una muestra de hogares para ser entrevistada, en cada
una de las manzanas seleccionadas.
Ejemplo
Para el estudio de rendimiento acadmico de estudiantes de primaria en
una ciudad, se utiliza una muestra seleccionada en dos etapas como
sigue:
Muestreo 54
Muestreo 55
Etapa 1
Etapa 2.
Elementos
Muestreo 56
6. PROCEDIMIENTOS DE ESTIMACIN
Usualmente, el objetivo que se persigue al implementar una encuesta por
muestreo es obtener informacin sobre una poblacin determinada; sin
embargo, como la recoleccin de datos se lleva a cabo solo para una muestra
de unidades, es necesario efectuar un proceso que permita extrapolar los
resultados de la muestra al conjunto total de unidades que conforman la
poblacin de la cual sta fue seleccionada.
La estimacin es el proceso de encontrar un valor plausible para una
caracterstica de la poblacin objetivo, basados en los datos recolectados en la
muestra. Estas caractersticas de inters pueden expresarse generalmente con
estadsticas como totales, promedios, proporciones o razones de las distintas
variables; como ejemplo, sobre una encuesta para medir qu hace la gente con
su tiempo libre, es posible estar interesado en la estimacin de:
Muestreo 57
6.1
N
n
k
r
n el tamao de
Muestreo 58
con Probabilidad
reemplazamiento - PPT:
f exp
1
1
( n) p i n
i 1
con
xi
Tamao
al
Xk
1 si k es hombre
2 si k es mujer
Zk
1 si k es hombre
0 en otro caso
Muestreo 59
X1k
1 si k es mujer
0 en otro caso
1 si k es hombre
2 si k es mujer
Zk
6.2
Muestreo 60
Ejemplos:
1. El total de ventas de los establecimientos de comercio en una
ciudad
2. El total de personas que asisti a teatro al menos una vez al
mes en el ltimo ao
3. El rea total nacional sembrada en arroz
Para su estimacin se emplea la frmula:
n
ty y i f exp
i 1
Establecimiento
Almacn La 4
Distribuidora Espinal
Ropa FASHION
fexp = N/n
Total de
ventas
Yi*fexp
240
240
240
13
13
13
18.462
18.462
18.462
850,600
186,400
80,200
15,703,385
3,441,231
1,480,615
Muestreo 61
No.
Establecimiento
5
15
204
158
72
156
51
123
172
220
fexp = N/n
Total de
ventas
240
240
240
240
240
240
240
240
240
240
13
13
13
13
13
13
13
13
13
13
18.462
18.462
18.462
18.462
18.462
18.462
18.462
18.462
18.462
18.462
65,000
160,000
45,000
45,200
36,800
68,700
32,000
320,000
87,000
65,800
Yi*fexp
1,200,000
2,953,846
830,769
834,462
679,385
1,268,308
590,769
5,907,692
1,606,154
1,214,769
37,711,385
Ejemplo 2. PPT
Utilizando la informacin del ejemplo de seleccin PPT con
mtodo sistemtico (Tabla 10), se estima el total de rea
sembrada en arroz:
Tabla 16. Estimacin de totales. Ejemplo PPT
No.
4
6
6
9
Finca
rea
(Ha)
AMANECER
264
ASTAIZA
350
ASTAIZA
350
EL PARAISO
78
TOTAL ESTIMADO
rea
sembrada
Pi
en arroz
(Ha)
0.257560976 0.970643939
210
0.341463415 0.732142857
300
0.341463415 0.732142857
300
0.076097561 3.28525641
0
fexp = 1/
(n*pi)
Yi*fexp
203.84
219.64
219.64
0.00
643.12
Muestreo 62
f exp
i 1
N
Con N el tamao conocido de la poblacin. En el ejemplo 1, la
variable y es la edad a la que se ingresa a la escuela y N es el
total de personas de la poblacin; en el ejemplo 2, la variable
involucrada es la cantidad de personas ocupadas y N es la
cantidad conocida de establecimientos industriales dedicados a la
manufactura de cuero, que puede ser una porcin de la poblacin
objetivo pero para la que el tamao debe ser conocido; en el
ejemplo 3, la variable corresponde al gasto anual en alimentos
reportado por cada hogar en la muestra y N es el total de hogares
en la poblacin. Como se mencion arriba, cuando la cantidad de
unidades no es conocida de antemano sino que se estima a partir
de la muestra, se utiliza la definicin de razn que se presenta en
el numeral 6.2.4.
Ejemplo 1. MAS
Utilizando la misma informacin del ejemplo 1 en el numeral 6.2.1,
suponga ahora que se desea estimar el promedio de ventas por
establecimiento. Basta con dividir el total estimado obtenido por el
tamao conocido de la poblacin (240) con lo que se obtiene un
promedio de ventas por establecimiento de $157.131 en el mes
anterior.
Muestreo 63
6.2.3 Proporciones
Una proporcin es un parmetro anlogo al promedio en donde la
variable que participa en la estimacin es de tipo cualitativo y por
tanto, se trabaja con la indicadora que representa la categora de
inters. Para este caso, se supone que el numerador est
contenido en el denominador y que el total de unidades N es
conocido y no se estima; cuando es necesario estimarlo, se utiliza
la definicin de razn del numeral 6.2.4. En general, se habla de
porcentajes ms que de proporciones, multiplicando stas por
100.
Ejemplos:
1. Porcentaje de personas que reside en una vivienda propia
2. Porcentaje de mujeres que ha tenido al menos un hijo nacido
vivo
3. Porcentaje de establecimientos econmicos con 10 o menos
personas ocupadas
La frmula de la estimacin, idntica a la de los promedios salvo
por la notacin es:
n
I
i 1
f exp
N
En este caso, se nota como I la variable involucrada, para
recordar que se trata de una variable indicadora o dummy y no de
una variable continua.
Haciendo referencia a los ejemplos, puede verse que es necesario
construir las variables indicadoras correspondientes a cada caso
(por ejemplo el tipo de tenencia de la vivienda normalmente no se
encuentra entre las caractersticas de las personas y es necesario
hacer algo adicional para generar la indicadora) y que,
dependiendo de cmo se construya la proporcin, el denominador
puede ser el tamao total de la poblacin o de una subpoblacin
de sta; en el ejemplo 2, el porcentaje tiene sentido si se calcula
sobre el total de mujeres o sobre el total de mujeres en edad frtil.
Ejemplo 1. MAS
Muestreo 64
Total
Propia, pagndola
Propia, totalmente pagada
En arriendo
En usufructo
En otra condicin
Total
143
21
75
3
8
250
250,000
250,000
250,000
250,000
250,000
fexp =
N/n
Total
Estimado
Total*fexp
250
250
250
250
250
1,000
1,000
1,000
1,000
1,000
143,000
21,000
75,000
3,000
8,000
Porcentaje
estimado
Total
estimado / N
57.20%
8.40%
30.00%
1.20%
3.20%
Muestreo 65
ty
tz
y
i 1
n
z
i 1
f exp
f exp
Muestreo 66
Sexo
Hombres
Mujeres
Edad
0-4 aos
5-11 aos
12-49 aos
50 aos y ms
0-4 aos
5-11 aos
12-49 aos
50 aos y ms
Total
fexp = N/n
Yi
Indicadora
Menor de
5
aos*Total
20
18
68
14
22
28
67
13
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
20
0
0
0
22
0
0
0
Zi
Indicadora
Mujer en
edad
frtil*Total
0
0
0
0
0
0
67
0
TOTALES ESTIMADOS
RELACIN NIOS-MUJER
Yi*fexp
Zi*fexp
20,000
0
0
0
22,000
0
0
0
42,000
0.627
0
0
0
0
0
0
67,000
0
67,000
Ejemplo 3. PPT
Suponga que se desea estimar el promedio de ventas del mes
anterior para establecimientos industriales en una ciudad. La
muestra se selecciona utilizando un diseo con probabilidad
proporcional al total de ventas del mismo mes el ao anterior,
generando los pi que se muestran en la Tabla 19.
Tabla 19. Estimacin de razones. Ejemplo PPT
Muestreo 67
Indicadora de
pertenencia a
la poblacin
objetivo
zi
Yi*fexp
Zi*fexp
Pi
fexp = 1/(n*P)
Ventas del
mes
anterior
yi
0.092
0.837
680,480
569,724
0.837
Maletas y Maletines
0.051
1.497
149,120
223,185
1.497
Cosmticos Sasson
0.009
8.296
64,160
532,265
8.296
0.073
1.050
104,000
109,221
1.050
Qumicos ITAKA
0.182
0.422
320,000
135,068
0.422
0.025
3.102
72,000
223,377
3.102
Muecos y Peluches
0.031
2.507
54,240
136,001
2.507
Servicios de molienda
0.020
3.856
29,440
113,524
3.856
0.031
2.507
109,920
275,557
2.507
0.001
59.588
12,800
762,731
59.588
Industrias ARMEN
0.080
0.959
256,000
245,618
0.959
0.025
3.133
34,800
109,013
3.133
MADECO
0.051
1.512
78,960
119,399
1.512
TOTALES ESTIMADOS
3,554,684
89
PROMEDIO DE VENTAS
39,821
Establecimiento
6.3
Muestreo 68
fexp =
Nh/nh
nh
BOGOTA
6,740,859
1,862 3620.225
ANDINA
16,597,681 3,166 5242.477
CARIBE
8,880,986
1,858 4779.863
PACIFICO
7,083,712
1,321 5362.386
LLANOS
1,571,104
1,282 1225.510
AMAZONICA 300,511
511
588.084
N
41,174,853
Total estimado
Porcentaje estimado con total conocido
Personas
que
viven en
su
vivienda
propia
782
1,614
730
1,014
670
445
Total
estimado
por
estrato
Porcentaje
estimado por
estrato con
denominador
conocido
2,831,016
8,461,357
3,489,300
5,437,459
821,092
261,697
42.0%
51.0%
39.3%
76.8%
52.3%
87.1%
21,301,922
51.74%
Muestreo 69
Cantidad de
cursos a
seleccionar
fexp =
N/n
Cantidad
de
estudiantes
Cantidad de
estudiantes
con puntajes
superiores a
8.5
yi
Indicadora de
pertenencia a
la poblacin
objetivo
zi
yi *fexp
zi*fexp
22
60.5
115.5
Primero
11
2.75
37
Segundo
11
2.75
42
Tercero
11
2.75
40
Cuarto
11
2.75
41
Quinto
11
2.75
41
Sexto
11
2.75
31
25
68.75
85.25
Sptimo
11
2.75
45
20
55
123.75
Octavo
11
2.75
42
Noveno
11
2.75
35
Dcimo
11
2.75
32
22
60.5
88
Undcimo
11
2.75
38
Total estimado
244.75
412.5
57.7%
59.3%
424
Muestreo 70
p1i
00010101
13
0.0616
00010102
11
0.0521
00010103
14
0.0664
00010104
11
0.0521
00010105
11
0.0521
00010106
13
0.0616
Manzana
00010204
00010205
12
16
0.0758
0.0332
00020101
20
0.0948
00020102
17
0.0806
00020103
14
0.0664
15
Hogares
Seleccionados
Ingresos
totales
yi
Hogar
con
nios
zi
fexp1 =
1/
(n1*p1i)
fexp2 =
N2/n2
fexp =
fexp1*fexp2
13
2,293,000
5.4103
4.3333
23.4444
1,852,300
5.4103
4.3333
23.4444
1,880,100
5.4103
4.3333
23.4444
15
1,982,700
4.3958
3.2000
2,121,100
4.3958
3.2000
14
1,747,900
4.3958
10
2,034,375
2,285,800
14
9
Yi*fexp
Yi*fexp*zi
zi*fexp
53,758,111
53,758,111
23.4444
43,426,144
43,426,144
23.4444
44,077,900
14.0667
27,889,980
27,889,980
14.0667
14.0667
29,836,807
29,836,807
14.0667
3.2000
14.0667
24,587,127
4.3958
3.2000
14.0667
28,616,875
28,616,875
14.0667
4.3958
3.2000
14.0667
32,153,587
32,153,587
3,475,900
4.6889
3.7500
17.5833
61,117,908
61,117,908
17.5833
1,529,200
4.6889
3.7500
17.5833
26,888,433
26,888,433
17.5833
13
2,868,100
4.6889
3.7500
17.5833
50,430,758
11
2,304,000
4.6889
3.7500
17.5833
40,512,000
40,512,000
17.5833
0.0569
00010206
00020104
Cantidad de
hogares a
seleccionar
0.0711
00020105
14
0.0664
00020106
13
0.0616
00020107
10
0.0474
211
Ingreso total estimado
Ingreso promedio estimado (denominador conocido)
Ingreso total estimado en hogares con nios
463,295,631
2,195,714
344,199,846
142
2,426,696
Muestreo 71
6.4
6.5
Encuestas esperadas
Encuestas efectivas
Muestreo 72
6.6
Muestreo 73
7.1
Muestreo 74
Muestreo 75
7.1.1
V ty
V ty
ty
Muestreo 76
4.
IC1 / 2 ty Z1 / 2 S ty
Donde Z1 / 2 es la ordenada de una distribucin normal
para el nivel de confianza respectivo. Para el 95% de
confianza se utiliza 1.96 y para el 99%, 2.58.
Como puede verse, todas las medidas presentadas
dependen de la varianza estimada, por tratarse de un tema
en el que la complejidad matemtica para deducir las
frmulas es mayor que la del captulo de estimacin, el
alcance de este documento se limitar a presentar las
frmulas empleadas para obtener esta estimacin en los
diseos utilizados en este documento y con los estimadores
considerados en el captulo 6.
De estos estimadores, totales, proporciones, promedios y
razones, solamente se abordarn los totales y las razones;
esto se debe a que las proporciones y promedios
presentados, corresponden a estimaciones de totales con
denominador conocido con lo que, utilizando las reglas de la
varianza,
ty
1
2 V ty
N
N
V y V
1
t
V p V I 2 V tI
N
N
Para los diseos que utilizan herramientas de estratificacin,
de muestreo de conglomerados o multietpicos, la jerarqua
con que se lleva a cabo la seleccin de unidades es
importante. Este tema se trata en ms detalle en el numeral
7.1.4.
Muestreo 77
Sy
1 n
yi y 2
n 1 i 1
Muestreo 78
VMAS ty
cve
ty
14.463.568
0.38
37.711.385
S tr
1
t i t sr
r 1 sr
Muestreo 79
Cantidad
de
personas
fexp =
k/r
yk*fexp
14
22
154
16
14
32
224
30
14
19
133
44
14
43
301
58
14
37
259
14
21
147
21
14
41
287
35
14
33
231
49
14
11
77
63
14
42
294
Rplica
Total estimado
Total rplica 1
2,107
153
Total rplica 2
148
12.5
Ponderador
Varianza estimada del total
Error estndar de estimacin
84
1,050
32
1.54%
2,043
2,171
Muestreo 80
n n 1
yi
tyMCR
i 1 p i
No.
Finca
rea
(Ha)
Pi
fexp = 1/
(n*pi)
rea
sembrada
en arroz
(Ha)
Yi*fexp
Yi/pi
(yi/pi - tmcr)2
AMANECER
264
0.258
0.9706439
210
203.84
815.34
29,659.72
ASTAIZA
350
0.341
0.7321429
300
219.64
878.57
55,436.93
ASTAIZA
350
0.341
0.7321429
300
219.64
878.57
55,436.93
EL PARAISO
78
0.076
3.2852564
0.00
0.00
413,604.55
TOTAL ESTIMADO
yi
tyMCR
i 1 pi
643.12
2
FACTOR DE PONDERACION
VARIANZA ESTIMADA DEL TOTAL
ERROR ESTANDAR DE ESTIMACIN
554,138.13
0.08
46,178.18
214.89
CVE
33.4%
221.93
1064.31
Muestreo 81
ty
se define una variable artificial
tz
1
y i R z i
tz
Ejemplo 1. PPT
Se pretende determinar el monto de ventas por persona ocupada
en el mes anterior en los establecimientos industriales de una
ciudad.
Para ello, se selecciona una muestra de 13
establecimientos con diseo PPT proporcional al total de ventas
del mismo mes el ao anterior. Los resultados se muestran en la
siguiente tabla:
Tabla 25. Estimacin de varianza para razones. Ejemplo PPT
Muestreo 82
Establecimiento
Ventas Personal
del mes ocupado
anterior
yi
zi
Yi*fexp
Zi*fexp
pi
fexp =
1/(n*pi)
0.092
0.051
0.009
0.837
1.497
8.296
680,480
149,120
64,160
5
11
8
569,724
223,185
532,265
4.186
16.463
66.367
1,562.9
130.5
-13.8
289,350,159.7
6,443,834.7
2,216,390.0
0.073
1.050
104,000
14
109,221
14.703
-44.5
368,723.2
0.182
0.025
0.031
0.020
0.422
3.102
2.507
3.856
320,000
72,000
54,240
29,440
1
10
12
5
135,068
223,377
136,001
113,524
0.422
31.025
30.089
19.281
763.9
-37.4
-123.8
-34.8
17,568,400.4
2,272,659.1
16,277,609.2
3,041,082.6
0.031
2.507
109,920
11
275,557
27.576
34.3
1,247,386.2
0.001
0.080
0.025
0.051
59.588
0.959
3.133
1.512
12,800
256,000
34,800
78,960
3
5
2
5
762,731
245,618
109,013
119,399
3,554,68
4
178.765
4.797
6.265
7.561
-32.8
521.2
42.6
86.7
645,927,018.9
42,258,894.9
3,007,543.1
2,907,096.2
TOTAL ESTIMADO
RAZN ESTIMADA
n
ui
Ui
(ui
estimado estimado/pi)^2
407
8,723.1
1,032,886,798.1
p
PONDERADOR
0.0064
i 1
i
VARIANZA ESTIMADA DE LA RAZON
ERROR ESTANDAR DE ESTIMACIN
CVE
LMITE INFERIOR DEL INTERVALO DEL 95% DE CONFIANZA
LMITE SUPERIOR DEL INTERVALO DEL 95% DE CONFIANZA
6,621,069.2
2,573.1
29.5%
3,679.8
13,766.5
estratificados,
de
Muestreo 83
Unidad
fexp
rea
sembrada
rea
sembrada*fexp
10
72.58
362.9
10
53.12
265.6
Total estimado
628.5
Varianza muestral
Varianza estimada
Fincas Medianas
189.3458
7573.832
1
2
24
24
3
3
8
8
12.15
18.2
97.2
145.6
Muestreo 84
Estrato
Unidad
fexp
rea
sembrada
24
14.35
Total estimado
9.377
Varianza estimada
1575.42
1
30
9.8
58.8
30
5.978
35.868
30
8.87
53.22
30
7.658
45.948
Total estimado
242.95
Varianza muestral
2.726
Varianza estimada
Fincas Muy
Pequeas
114.8
357.6
Varianza muestral
Fincas Pequeas
rea
sembrada*fexp
531.631
1
36
7.2
1.987
14.3064
36
7.2
2.478
17.8416
36
7.2
4.325
31.14
36
7.2
3.124
22.4928
36
7.2
2.57
18.504
Total estimado
104.2848
Varianza muestral
0.8003257
Varianza estimada
178.6327
Total estimado
1332.63
Varianza estimada
9859.516
99.29
7.5%
951.22
1714.13
Muestreo 85
Muestreo 86
Conglomerado
Manzana
Total
Hogares
manzana
Pi
Ingresos
totales
tyi
fexp1 =
1/(n*pi)
Tyi*fexp
(tyi/pi - tmcr)2
16,669,893
6.6333333
110,576,957
123,009,101,739,048
8.2916667
116,260,999
35,535,656,120,344
4.7380952
115,983,862
26,314,517,156,726
00010106
10
0.0503
00010205
0.0402
00020104
14
0.0704
14,021,427
24,479,006
199
Total estimado
342,821,818
t yi
i 1
pi
1,722,723
tyMCR
184,859,275,016,118
30,809,879,169,353
5,550,665
1.62%
778,007,605
27,893
1.62%
1,668,053
1,777,393
Muestreo 87
Muestreo 88
Muestreo 89
Total de
hogares
00010106
p1i
10
00010205
0.0503
00020104
Cantidad de
hogares a
seleccionar
0.0402
14
0.0704
Hogares
Seleccionados
Ingresos
totales
yi
fexp1 =
1/(n1*p1i)
fexp2 =
N2/n2
fexp =
fexp1*
fexp2
Yi*fexp
Yi*fexp2
1,050,086
6.6333
3.3333
22.1111
23,218,568
3,500,287
2,499,756
6.6333
3.3333
22.1111
55,272,383
8,332,520
1,021,935
6.6333
3.3333
22.1111
22,596,118
3,406,450
2,162,601
8.2917
1.6000
13.2667
28,690,507
3,460,162
2,353,038
8.2917
1.6000
13.2667
31,216,971
3,764,861
2,319,190
8.2917
1.6000
13.2667
30,767,921
3,710,704
1,408,314
8.2917
1.6000
13.2667
18,683,632
2,253,302
1,814,085
8.2917
1.6000
13.2667
24,066,861
2,902,536
14
1,228,834
4.7381
3.5000
16.5833
20,378,164
4,300,919
2,131,870
4.7381
3.5000
16.5833
35,353,511
7,461,545
13
2,475,740
4.7381
3.5000
16.5833
41,056,022
8,665,090
11
2,469,404
4.7381
3.5000
16.5833
40,950,950
8,642,914
Total estimado
tyi
i 1
p
i
4,759,675,157,245,440
785,460,471,347,786
1,678,076,439,766,480
372,251,607
(tyiest/pi - tmcr)2
1,870,611.089
tyMCR
7,223,212,068,359,700
1,203,868,678,059,950
34,696,811
9.32%
30399956517.76
174,355.83
9.32%
1,200,805.72
2,540,416.45
Muestreo 90
7.2
La validez y el sesgo
La validez, vista desde los errores muestrales, hace referencia a una
caracterstica deseable en los estimadores que se denomina
insesgamiento o ausencia de sesgo. El sesgo es una desviacin
entre el verdadero valor del parmetro, que es una cantidad
desconocida y el valor esperado del estimador que se utiliza para
aproximarse a l. El sesgo solamente puede ser definido en forma
terica, o calculado como el promedio de todas las posibles
estimaciones, ponderado por la probabilidad de seleccin de cada
muestra, sobre el conjunto de todas las muestras posibles sujetos a
una poblacin, diseo y estimador determinados, como en el ejercicio
presentado en el captulo 2 para el muestreo aleatorio simple. Si bien
el estimado a partir de una muestra seleccionada puede presentar
distancia con respecto al valor real del parmetro, el insesgamiento se
refiere a que en promedio, el valor del estimador coincida con el del
parmetro que se pretende estimar. Desviaciones sistemticas por
encima o por debajo del valor del parmetro llevan a conclusiones
invlidas sobre la poblacin objetivo.
En el desarrollo de una encuesta puede haber varias fuentes de
sesgo, la mayora de ellas relacionadas con los errores no muestrales
que se tratarn en el captulo 8. Con respecto a los errores muestrales
puede decirse que la mayora de los estimadores que se utilizan en la
prctica son insesgados o aproximadamente insesgados; en su lugar,
pueden generarse sesgos importantes como resultado de una mala
aplicacin de las frmulas de los estimadores como por ejemplo,
cuando se lleva a cabo un diseo que asigna probabilidades de
inclusin o seleccin diferenciales a las unidades y no se tiene en
cuenta estas probabilidades en la frmula del estimador.
Muestreo 91
8.1
Muestreo 92
Muestreo 93
Muestreo 94
Muestreo 95
Muestreo 96
Muestreo 97
BIBLIOGRAFIA
Bautista L. Diseos de muestreo estadstico. Universidad Nacional de
Colombia. 1998.
Srndal, C.E., Swensson, B., Wretman, J., Model Assisted Survey Sampling.
Ed. Springer Verlag. 1992.
Srndal, C.E., Lndstrom S. Estimation in surveys with nonresponse. Ed.
Wiley. 2005.
Statistics Canada. Statistics: Power from Data! 2006.
http://www.statcan.ca/english/edu/power/toc/contents.htm
Lohr S. Muestreo: Diseo y Anlisis. Internacional Thomson Editores. 2000.
DANE. Documento de apoyo docente Muestreo. Tcnicas de Diseo y
Desarrollo de Encuestas. 1997.
Satin A., Shastry W. Survey Sampling: A non-mathematical Guide. 2a.
Edicin. Statistics Canada. 1993.