You are on page 1of 24

MUESTREO ALEATORIO ESTRATIFICADO.

Una tcnica ms reciente en el proceso de recoleccin de datos, consiste en las encuestas por
muestreo. Por medio de stas se trata de obtener la informacin de una pequea porcin
(muestra) de la poblacin que debe representar a la totalidad. La mayora de las veces los
resultados de la muestra no interesan por si solos, sino que son un medio para inferir o
generalizar resultados hacia la poblacin total o a una buena parte de ella.

1.1 Seleccin de una muestra aleatoria estratificada.


Una muestra aleatoria estratificada se obtiene mediante la separacin de los elementos de la
poblacin en conjuntos que no presenten interseccin, llamados estratos, y la seleccin
posterior de una muestra aleatoria simple en cada estrato.
Los estratos deben formarse de manera que los elementos de cada estrato sean lo ms
homogneos que se pueda entre s (ms homogneos que el conjunto de la poblacin) y las
diferencias entre un estrato y otro sean las mayores posibles. Esta forma de construir los
estratos conduce a muestras con poca variabilidad entre las mediciones que producirn
pequeas varianzas de los estimadores y por tanto menores lmites para los errores de
estimacin que con otros diseos de la muestra.
Otras ventajas adicionales que presenta este tipo de muestreo son las siguientes:
A veces los estratos se corresponden con zonas compactas bien definidas con lo que se
reduce el coste de la muestra.
Adems de las estimaciones para toda la poblacin, este muestreo permite hacer
estimaciones de los parmetros poblacionales para los estratos.

Antes de continuar fijemos la notacin que va a utilizarse (a la izquierda para la poblacin, a


la derecha para la muestra):
L = nmero de estratos
N = tamao de la poblacin

n = tamao de la muestra

N i = tamao del estrato

ni = tamao de la muestra del estrato i

N = Ni

n = ni

i = media poblacional del estrato i

y i = media muestral del estrato i

i =1

i = total poblacional del estrato i


1

i =1

i2 = varianza poblacional del estrato i

Si2 = cuasivarianza muestral del estrato i

pi = proporcin poblacional del estrato i

p i = proporcin muestral del estrato i

ci = coste de una observacin del estrato i

1.2 Estimacin de la media, proporcin y total poblacionales.


En cada estrato se ha realizado un muestreo aleatorio simple, sabemos que en cada estrato
L

i =1

i =1

N i y i es un estimador insesgado del total i , estimaremos = i por st = N i y i


media poblacional =

mediante y st =

1
N

y la

N
i =1

yi

y st y en general ( y = media muestral de las n observaciones)

NOTA:

st en general ( = N y = estimador del total segn un m.a.s.)

Varianza estimada de y st
1 L 2
1 L 2 Si2 N i ni
N
V
(
y
)
=

Ni n N
i
i
N 2 i =1
N 2 i =1
i
i
Se obtiene aplicando que la varianza de la suma de variables independientes es la suma de
V ( y st ) =

sus varianzas y que V (kX ) = k 2V ( X ) .

Varianza estimada de st
L
S2 N n
V ( st ) = N 2 V ( y st ) = N i2 i i i
ni N i
i =1

En el caso de variables dicotmicas los estimadores de la proporcin y total poblacionales as


como sus varianzas toman valores similares a los anteriores, salvo las diferencias de notacin
ya comentadas en la leccin anterior.

Estimador de la proporcin poblacional p


p st =

1
N

N
i =1

pi

Varianza estimada de p st

V ( p st ) =

1
N2

Ni2 V ( pi ) =
i =1

1
N2

Ni2
i =1

pi q i N i ni
ni 1 N i

Estimador del total poblacional


L

st = N p st = N i pi
i =1

Varianza estimada de st
L
p q N n
V ( st ) = N 2 V ( p st ) = N i2 i i i i
ni 1 N i
i =1

Ejemplo 1.1. Se est interesado en determinar la audiencia de la publicidad televisiva en una


cadena local de un municipio, se decide realizar una encuesta por muestreo para estimar el
nmero de horas por semana que se ve la televisin en las viviendas del municipio. ste est
formado por tres barrios con diferentes perfiles socio-culturales que afectan a la audiencia
televisiva. Hay 210 hogares en el barrio A, 84 en el barrio B y 126 en el barrio C. La empresa
publicitaria tiene tiempo y dinero suficientes para entrevistar 30 hogares y decide seleccionar
muestras aleatorias de tamaos: 15 del barrio A, 6 del barrio B, y 9 del barrio C.
Se seleccionan las muestras aleatorias simples y se realizan las entrevistas. Los resultados,
con mediciones del tiempo que se ve la televisin en horas por semana, se muestran en la
siguiente tabla:
BARRIO A
36
34
26
39
38
32
38
37
29
28
41
35
29
37
41

BARRIO B
20
25
30
14
41
39

BARRIO C
14
22
15
17
21
11
20
14
24

Estime el tiempo medio que se ve la televisin y el lmite para el error de estimacin, en horas por
semana, para:
a) Los hogares del barrio A.
b) Los hogares del barrio B.
c) Los hogares del barrio C.
d) Todos los hogares

Solucin: en primer lugar se calculan las medias y cuasivarianzas muestrales en cada estrato
y1 = 34, 67 horas / semana

y 2 = 28,17 h / s

y 3 = 17, 56 h / s S12 = 23, 24 S 22 = 112,57 S32 = 19, 28

y = 28, 23

S 2 = 92, 74

A partir de estos valores calculamos las varianzas de los estimadores de la media en cada
estrato y los lmites para los errores de dichas estimaciones
N1 = 210 N 2 = 84 N 3 = 126 N = N1 + N 2 + N 3 = 420

n1 = 15 n2 = 6 n3 = 9 n = n1 + n2 + n3 = 30
S12 N1 n1
V ( y1 ) =
= 1, 44
n1 N1

S 22 N 2 n2
V ( y2 ) =
= 17, 42
n2 N 2

S32 N 3 n3
V ( y3 ) =
= 1, 99
n3 N 3

2 V ( y1 ) = 2, 40 h / s
2 V ( y 2 ) = 8,35 h / s
2 V ( y 3 ) = 2,82 h / s
Para el conjunto de todos los hogares el estimador de la media es
1 3
Ni y i = 28, 23 h / s
N i =1
y la varianza de este estimador la podemos calcular basndonos en las varianzas de los
y st =

estimadores de la media en cada estrato mediante


1
V ( y st ) = 2
N

N
i =1

2
i

V ( y i ) = 1, 24

o, si se prefiere, utilizando
1 3 2 Si2 N i ni
Ni n N
N 2 i =1
i
i
el error para la estimacin de la media para todos los hogares est dado por
V ( y st ) =

2 V ( y st ) = 2, 22 h / s

Ejemplo 1.2. En el caso anterior, tambin se desea saber qu proporcin de hogares ven un
determinado programa, para decidir la conveniencia de insertar un anuncio en los intermedios
del mismo. La respuesta a la pregunta de si ven dicho programa en los hogares de la muestra
anterior se recoge a continuacin:
BARRIO A
BARRIO B BARRIO C
SI
NO
SI
SI
SI
NO
SI
SI
SI
SI
NO
SI
SI
NO
NO
NO
SI
SI
SI
NO
SI
NO
SI
NO NO
SI
NO
NO
SI
SI
Estime con un intervalo de confianza la proporcin de hogares del municipio donde se ve el
programa.

Solucin: en primer lugar se calculan las proporciones muestrales en cada estrato


p1 =

7
= 0, 4667
15

p2 =

5
= 0,8333
6

p3 =

6
= 0, 6667
9

La estimacin puntual de la proporcin de hogares del municipio donde se ve el programa es


1 3
Ni pi = 0, 60
N i =1
la varianza y error de estimacin asociados son
p st =

V ( p st ) =

1
N2

N
i =1

2
i

pi q i N i ni
= 0, 00748
ni 1 N i

2 V ( p st ) = 0,173
4

y el intervalo de confianza expresado en porcentajes es

( 60% 17,3% ) = ( 42, 7%, 77,3% )


1.3 Determinacin del tamao muestral.
El tamao muestral para conseguir un lmite para el error de estimacin de la media, B, viene
dado por 2 V ( y st ) = B donde V ( y st ) =

1
N2

N
i =1

2
i

i2 N i ni
ni N i 1

No podemos despejar el valor de todos los ni de una sola ecuacin a menos que conozcamos
la relacin entre los ni y n . Hay diversas formas de asignar el tamao muestral n en los
diferentes estratos

(problema de la asignacin de la muestra que estudiaremos a

continuacin), sustituyendo ni = ni en V ( y st ) se puede despejar n en funcin de los i


obteniendo el tamao muestral aproximado que se requiere para estimar con un lmite para
el error de estimacin B.
L

n=

i =1

N i2 i2

N 2 D + N i i2
i =1

B
D=
4

B2
y la misma expresin vale para el total tomando D =
.
4N 2

Al igual que en el m.a.s. para poder usar la anterior ecuacin necesitamos conocer las
varianzas poblacionales de los estratos o valores aproximados de ellas, para lo cual se pueden
usar las cuasivarianzas muestrales de una muestra previa o basarnos en el rango de variacin
de las observaciones dentro de cada estrato.
En el caso de variables dicotmicas se obtiene una expresin similar, teniendo en cuenta que
en este caso particular i2 = pi qi
L

n=

i =1

N i2 pi qi

N 2 D + N i pi qi
i =1

D=

B2
B2
(para estimar p) y la misma expresin vale para el total tomando D =
.
4
4N 2

1.4 Asignacin de la muestra.


Hay diversas formas de asignar el tamao muestral n en los distintos estratos.
El objetivo del diseo de una encuesta por muestreo es proporcionar estimadores con varianza
pequea (por tanto, pequeo error de estimacin) al menor coste posible.
El mejor esquema de asignacin est influido por:

El nmero total de elementos en cada estrato.

La variabilidad de las observaciones en cada estrato.

El coste de obtener una observacin en cada estrato.

1.4.1 Asignacin ptima.


La asignacin que minimiza el coste para un lmite para el error de estimacin fijado, B, se
denomina asignacin ptima y est dada por

N j j
cj

j =

i =1

N i i
ci

sustituyendo los j en la expresin que obtenamos antes para n se tiene el tamao total de la
muestra segn la asignacin ptima
L

Ni i ci

i =1

n=

i =1

Ni i
ci

N 2 D + N i i2
i =1

En el caso dicotmico las anteriores expresiones toman los valores


pjq j
cj

Nj

j =

N
i =1

N
n=

i =1

pi qi
ci
L

pi qi ci

i =1

pi qi
ci

N 2 D + N i pi qi
i =1

B2
B2
D=
(para estimar la media o p), D =
(para estimar el total).
4
4N 2

En algunas ocasiones interesa encontrar la asignacin que minimiza el error de estimacin


para un coste total fijo de obtencin de la muestra, C. En este caso la asignacin ptima
tambin es la respuesta y el tamao total de la muestra, n, viene dado por:
N i i
ci

C
n=

i =1

N
i

i =1

ci

Anlogamente para el caso dicotmico sustituyendo i =

pi qi .

1.4.2 Asignacin de Neyman.


Cuando los costes de observacin de cada estrato son los mismos, las expresiones de la
asignacin ptima se simplifican y transforman en:
Caso numrico
N j j

j =

N
i

i =1

( N )
L

n=

i =1

N 2 D + N i i2
i =1

Caso dicotmico

j =

N j pjqj
L

N
i =1

( N

pi qi
2

n=

i =1

pi qi

N 2 D + N i pi qi
i =1

A este tipo de asignacin se le denomina de Neyman que coincide con la asignacin ptima
solamente cuando los costes de observacin son iguales en todos los estratos. Esta asignacin
se utiliza an cuando los costes de observacin no son idnticos, a veces, sencillamente no se
conocen.
1.4.3 Asignacin Proporcional.
Si adems de los costes, coincide el valor de las varianzas en cada uno de los estratos, las
expresiones de la asignacin ptima y de Neyman se simplifican y reducen a
7

Caso numrico
Nj

j =

n=

N
i

i =1

ND +

1
N

2
i

N
i

i =1

2
i

Caso dicotmico
Nj

j =

n=

N pq
i

i =1

ND +

1
N

i i

N pq
i =1

i i

La asignacin Proporcional puede y suele utilizarse cuando las varianzas y costes de


observacin no son iguales para cada estrato, por la simplicidad de los clculos y por las
ventajas que presenta frente a los anteriores tipos de asignaciones:
Cuando se utiliza la asignacin Proporcional el estimador y st coincide con la media muestral
de la muestra que rene a todas las muestras de cada estrato, y st = y (anlogamente para p st
y el total).
Cuando se observa ms de una variable en cada unidad muestral para estimar ms de un
parmetro poblacional aparecen complicaciones en la asignacin y determinacin del tamao
muestral. Con la asignacin Proporcional y tomando como n el mximo de los valores
encontrados para cada estimacin se resuelve el problema como puede verse en el siguiente
ejemplo:
En la asignacin ptima y en la de Neyman los i dependen de las varianzas y pueden ser
distintos de una variable a otra
1 estimacin: n = 100 1 = 0,10 n1 = 10 2 = 0,90 n2 = 90
2 estimacin: n = 40 1 = 0,50 n1 = 20 2 = 0,50 n2 = 20
An tomando el mayor de los tamaos muestrales (100) y pasando la encuesta a 10 individuos
del estrato 1 y 90 del estrato 2 no tenemos garantizado que se satisfaga el error de estimacin
fijado para la segunda estimacin que necesita al menos 20 individuos de cada estrato.

En la asignacin Proporcional no ocurre lo anterior pues los j =

Nj
N

son iguales para todas

las variables al no depender de sus varianzas, as si en dos estimaciones para los niveles de
error requeridos tenemos lo siguiente
1 estimacin: n = 100 1 = 0,30 n1 = 30 2 = 0, 70 n2 = 70
2 estimacin: n = 40 1 = 0,30 n1 = 12 2 = 0, 70 n2 = 28
tomando como n el mximo de los dos (y en general para k variables), se tiene garantizado
que se cumple con los lmites para el error fijados para todas las estimaciones.
Ejemplo 1.3 Continuando con el ejemplo 2.1
a) Qu tipo de asignacin se ha utilizado?
Debido a los traslados necesarios no cuesta lo mismo obtener una observacin en un barrio
que en otro. Se estima que el coste de una observacin del barrio A es de 1, 9 para el barrio
B y 4 para el barrio C.
b) Cuntos hogares deberan entrevistarse para estimar el nmero medio de horas a la
semana que se ve la televisin en los hogares del municipio con un error inferior a 1
hora. (Tmese los anteriores datos como una muestra previa para estimar los
parmetros necesarios).
c) Supngase que se tiene slo 600 para gastar en el estudio, determine el tamao de la
muestra y la asignacin que minimizan el error de estimacin. (Como en el apartado
anterior, tmese los datos de la tabla como una muestra previa para estimar las
varianzas de los estratos).
Solucin:
a) Podemos comprobar que se cumple ni =
ni N i
=
n N

Ni
N

n i = i i
N
N

o equivalentemente que

15 210
=
= 0, 5
30 420

6
84
=
= 0, 2
30 420

9 126
=
= 0, 3
30 420

luego la asignacin utilizada ha sido la Proporcional.


b) Segn los datos anteriores estimamos las varianzas de cada estrato por
2

1 = S12 = 23, 24

2 = S22 = 112,56

3 = S32 = 19, 28

D=

Ni

ci

N i i ci

210
84
126
420

4,8208
10,6094
4,3909

1
3
2

1012,368
2673,5688
1106,5068
4792,4436

N i i
ci
1012,368
297,0632
276,6267
1586,0579

N i i2

4880,4
9455,04
2429,28
16764,72

B2 1
= = 0, 25
4 4
3

N
n=

i =1

Ni i
ci

ci

i =1

N 2 D + N i i2

4792, 4436 1586, 0579


= 124,89
( 4202 0, 25) + 16764, 72

i =1

N1 1
c
1 = 3 1 = 0, 6383
N i i

ci
i =1
n1 = n1 = 79, 71 80

2 = 0,1873

n2 = n2 = 23,39 24

3 = 0,1744

n3 = n3 = 21, 78 22

n = 80 + 24 + 22 = 126
c) En el supuesto de que se disponga slo de 600 para realizar el estudio
N i i
ci

600
n=

i =1

N
i =1

ci

600 1586, 0679


= 198,57
4792, 4436

y la asignacin de la muestra en cada estrato est dada por la asignacin ptima


n1 = 0, 6383n = 126, 75 126

n2 = 0,1873n = 37,19 37
n = 126 + 37 + 34 = 197

n3 = 0,1744n = 34, 63 34

o bien resolviendo la ecuacin


c1n1 + c2 n2 + c3 n3 = 600
donde ni = i n
c11n + c22 n + c33 n = 600

n=

600
600
=
= 198,57
c11 + c22 + c33 3, 0216

A partir de n se obtienen los ni = i n segn la asignacin ptima.

10

Ejemplo 1.4 Continuando con el ejemplo 1.2


a) Cuntos hogares deberan entrevistarse si se quisiera hacer dicha estimacin con un
error inferior al 5%. (Supngase que se realiza la entrevista por telfono y el coste de
las observaciones es el mismo para todos los casos al no ser necesarios los traslados.
Tmese los anteriores datos como una muestra previa para estimar los parmetros
necesarios)
b) Respndase a la pregunta anterior pero suponiendo que no se tiene ninguna
informacin previa sobre la proporcin de hogares donde se ve el programa.
Solucin: a)
Ni

pi

qi

N i pi qi

N i pi qi

210
84
126
420

0,4667
0,8333
0,6667

0,5333
0,1667
0,3333

52,2671
11,6685
27,9986
91,9342

104,7669
31,3075
59,3955
195,4699

B 2 0, 052
D=
=
= 0, 000625
4
4

( N

n=

i =1

pi qi

N 2 D + N i pi qi

195, 46992
= 188,98
( 4202 0, 000625) + 91,9342

i =1

n1 = n1 = n

N1 p1q1

= 188,98

N
i =1

anlogamente n2 = 30, 27 31

pi qi

104, 7669
= 101, 29 102
195, 4699

n3 = 57, 42 58

n = 102 + 31 + 58 = 191

b)
Ni
210
84
126
420

pi
0,5
0,5
0,5

qi
0,5
0,5
0,5

N i pi qi
52,5
21
31,5
105

n=

n1 = 204,878

N pq
i =1

1
ND +
N

i i

N pq
i =1

i i

105
105
( 420 0, 000625 ) +
420

210
= 102, 439 103 anlogamente n2 = 40,98 41
420
n = 103 + 41 + 62 = 206

11

= 204,878

n3 = 61, 46 62

El muestreo estratificado no siempre conduce a un estimador con menor error de


estimacin, esto suele ocurrir cuando los estratos no estn formados por elementos
suficientemente homogneos. Muchas veces es debido a que predomina el deseo de obtener
estimaciones en cada estrato (por ejemplo, en un estudio regional tambin se quieren obtener
estimaciones a nivel provincial) frente al objetivo de minimizar los errores de los estimadores.
Este problema queda bien ilustrado con el siguiente ejemplo.
Ejemplo 1.5 Un distribuidor de productos de limpieza desea conocer el consumo por hogar
durante un ao de un determinado producto en una comarca formada por cuatro municipios.
Para estimar de paso tambin el consumo en cada municipio decide usar muestreo
estratificado tomando cada municipio como un estrato. Se sabe que el 20% de la poblacin de
la comarca vive en el municipio 1, el 30% en el municipio 2, el 25% en el municipio 3 y el
25% restante en el municipio 4. El distribuidor tiene medios suficientes para controlar y
obtener datos sobre el consumo anual de 20 hogares.
Dado que no tiene informacin previa respecto a las varianzas de los estratos y porque el coste
del muestreo es el mismo en cada municipio, decide aplicar asignacin Proporcional, la cual
conduce a
N1
= 20 0, 20 = 4 de forma similar n2 = 6 n3 = 5 n4 = 5 .
N
Obteniendo los resultados de la tabla siguiente (consumo expresado en euros).
n1 = n

Estrato 1
470
510
500
550

y1 = 507,5 S12 = 1091,67

Estrato 2
490
500
470
520
550
500
y 2 = 505 S22 = 750

Estrato 3
540
480
500
470
470

Estrato 4
450
560
460
440
580

y 3 = 492 S32 = 870 y 4 = 498 S42 = 4420

Estime el consumo anual medio por hogar y fije un lmite para el error de estimacin.

Solucin:
y st =

1
N

N1
= 0, 20
N

i =1

i =1

Ni y i =

N2
= 0,30
N

N3
= 0, 25
N

N4
= 0, 25
N

Ni
y i = ( 0, 20 507, 5 ) + ( 0,30 505 ) + ( 0, 25 492 ) + ( 0, 25 498) = 500,5
N

Obsrvese que cuando se utiliza la asignacin Proporcional y st = y , efectivamente


y=

1 20
10010
yi =
= 500,5

n i =1
20

12

En la siguiente expresin consideramos los coeficientes correctores para poblaciones finitas en


cada estrato iguales a la unidad
1
V ( y st ) = 2
N

4
2
N i Si2
Si2 N i ni
N i2 Si2
N
= 2
=
=

ni N i
ni
i =1
i =1 N
i =1 N ni
4

2
i

1091, 67

2 750
2 870
2 4420
= 0, 202
+ 0, 30
+ 0, 25
+ 0, 25
= 88, 29
4
6
5
5


2 V ( y st ) = 18, 79

Supongamos que el distribuidor hubiera decidido tomar una muestra aleatoria simple de 20
hogares, los mismos 20 de la tabla anterior, entonces el estimador de la media hubiera sido
y=

1 20
yi = 500, 5
n i =1

que coincide con el estimador del muestreo estratificado por las razones mencionadas
anteriormente, pero la varianza estimada y error de estimacin asociados tomaran los valores
S n21 = 1520, 79
V ( y) =

S n21 N n 1520, 79
=
= 76, 04
n
N
20

, se supone

N n
1
N

2 V ( y ) = 17, 44
Se observa que el error de estimacin es menor en el caso del muestreo aleatorio simple, esto
es debido a que el distribuidor no tuvo en cuenta que el consumo vara mucho dentro del
cuarto municipio. Pudo haber obtenido un error menor si hubiera estratificado en base al
tamao de las familias u hogares, esto es, colocando los hogares pequeos en un estrato, los
medianos en otro, ..., es decir, formando los estratos con hogares que tengan un consumo
similar.

1.5 Estratificacin despus de seleccionar la muestra.


A veces no se sabe a qu estrato pertenece un dato hasta que no se observa (por ejemplo,
estratos segn sexo y entrevista telefnica).
Supngase una muestra aleatoria simple de n personas para una encuesta. La muestra puede
ser dividida en n1 masculinos y n2 femeninos despus de que ha sido realizada. Entonces en
lugar de usar y para estimar , podemos usar y st siempre que

Ni
sea conocido para todo i.
N

Obsrvese que en esta situacin los ni son aleatorios, ya que varan de una muestra a otra
aunque n sea fijo. Luego esto no es una muestra aleatoria estratificada en pleno sentido, pero

13

si

Ni
es conocido y ni 20 i , entonces este mtodo de estratificar despus de la seleccin
N

es casi tan exacto como el muestreo aleatorio estratificado con asignacin Proporcional. Este
mtodo no debe usarse si

Ni
o una buena aproximacin de su valor se desconocen.
N

Ejemplo 2.6 En una ciudad se sabe que el 30% de los hogares tienen calefaccin elctrica. Al
realizar una encuesta sobre el consumo de energa (valor en euros de la factura bimensual) se
obtuvieron los siguientes resultados:
Tipo Calefaccin N casas Valor total de las facturas desviacin tpica muestral
Elctrica
60
5730
200
No elctrica
40
2080
90
Obtenga una estimacin del valor medio de la factura de electricidad en la ciudad y el lmite
para el error de estimacin.
Solucin: Ya que la proporcin observada de facturas de hogares con calefaccin elctrica
(0,60=60/100) est muy alejada de la proporcin verdadera (0,30), es conveniente la
estratificacin despus de que se ha seleccionado la muestra aleatoria simple. Adems el
procedimiento se justifica pues tanto n1 como n2 superan 20.
y1 =

y st =

1
N

5730
= 95,5
60

i =1

i =1

Ni y i =

1
V ( y st ) = 2
N

y2 =

2080
= 52
40

Ni
y i = (0, 30 95,5) + (0, 70 52) = 65, 05
N

2
Si2 N i ni
N i2 Si2 N i ni
N
= 2

ni N i
ni N i
i =1
i =1 N
2

2
i

omitiendo el coeficiente corrector por poblaciones finitas se tiene


2

V ( y st ) =
i =1

2
2
2
N i Si2

N i2 Si2
2 200
2 90
=
=
+
0,30
0,
70


= 159, 225
N 2 ni
ni
60
40
i =1 N

2 V ( y st ) =25,24

A veces este mtodo de estimacin se utiliza para ajustar por no respuesta. Por ejemplo, si
muchos de quienes no respondieron a una muestra aleatoria simple son varones, entonces la
proporcin de varones en la muestra va a ser pequea, y se podra conseguir un estimador
ajustado mediante la estratificacin despus del muestreo.

14

As, en este ejemplo la baja representacin en la muestra de facturas sin calefaccin elctrica y
la alta de facturas con calefaccin elctrica conducen a una sobreestimacin del valor medio
de las facturas si se utiliza muestreo aleatorio simple y no se ajusta la estimacin de la media
con la estraficacin despus de seleccionar la muestra:
y=

5730 + 2080 7810


=
= 78,10
60 + 40
100

Con el muestreo aleatorio simple sobrevaloraramos el consumo medio de electricidad por


hogar (78,10>>65,05).

15

ALGUNOS EJERCICIOS
1. Se desea conocer el nmero de fines de semana que las familias de una gran ciudad salen
fuera de ella. Se sabe que el 425% de las familias tienen de 0 a 2 hijos, el 30% tienen de 3
a 5 hijos y el 275% tienen ms de 5 hijos. Se realiz un muestreo segn el nmero de
hijos y se pregunt a las familias sobre los fines de semana que pasan fuera, obtenindose
los siguientes datos:

Nmero de hijos ni

yi

S i2

i =1

0-2
3-5
Mas de 5

25 239
19 174
16 78

6076
6301
7824

Estimar el nmero medio de fines de semana que las familias pasan fuera de la ciudad y
dar el lmite de error de estimacin. Omitir el corrector por poblacin finita.

SOLUCIN:

y1 =

y st =

Si

1
N

239
= 9,56
25

i =1

i =1

Ni y i =

y2 =

174
= 9,16
19

y3 =

78
= 4,87
16

Ni
y i = ( 0, 425 9, 56 ) + ( 0, 30 9,16 ) + ( 0, 275 4,87 ) = 8,15
N

N i ni
1
= 1 V ( y st ) = 2
Ni
N

Si2 N i ni
1
N
= 2

ni N i
N
i =1
L

2
i

2
L
L
Si2
N i2 Si2
N i Si
N
= 2
=
=

ni
ni
i =1
i =1 N
i =1 N ni
L

2
i

60, 77

2 63, 01
2 78, 24
= 0, 4252
+ 0,30
+ 0, 275
= 1,107
25
19
16

2 1,107 = 2,1
2. Una compaa de autobuses est planeando una nueva ruta para dar servicio a cuatro
barrios. Se tomaron muestras aleatorias de hogares en cada barrio y se solicit a los
miembros de la muestra que valorasen en una escala de 1 (totalmente opuesto) a 5
(totalmente a favor) su opinin sobre el servicio propuesto. Los resultados se resumen en la
tabla adjunta:

16

Barrio
1
2
3
4
N i 240 190 350 220
ni
25 25 25 25
y i 3,5 3,6 3,9 3,8
S i 0,8 0,9 1,2 0,7
a) Halle un intervalo de confianza para la opinin media de los hogares que dispondrn del
nuevo servicio.
b) Si se asigna la muestra de 100 hogares de la mejor forma, determine cuntos
perteneceran al barrio 3. (Suponga iguales los costes de observacin)
SOLUCIN:
a)
L

N = N i = 1000

y st =

i =1

1
N

Ni y i =3, 725
i =1

B = 2 V ( y st ) = 0,1973
b)
n3 = n3 = 100

N 3 3

= 100

N
i =1

V ( y st ) =

1
N2

Ni2
i =1

Si2 N i ni
= 0, 00973
ni N i

( 3,5277 , 3,9223)

350 1, 2
=
(240 0,8) + (190 0,9) + (350 1, 2) + (220 0, 7)

= 100 0, 4482 = 44,82 45


3. Una empresa especializada en seguros est pensando en ofrecer sus servicios a las
empresas de los polgonos industriales de una ciudad. Para ajustar sus tarifas desea estimar
el gasto en pequeas reparaciones de mantenimiento (objeto del seguro) de dichas
empresas. Se clasifican las empresas en funcin de su tamao. El nmero de empresas de
cada tipo, el coste de obtencin de esta informacin en cada empresa as como los valores
mnimos, medios y mximos de un estudio similar hecho hace dos aos se expresan en la
siguiente tabla (los costes y gastos estn expresados en euros)
Tipo de
Nmero de
Costes de
Gastos de reparacin
empresa
empresas
observacin
Mnimo
Media
Mximo
A
100
16
400
500
600
B
500
9
240
300
360
C
700
4
70
100
130
Si la empresa de seguros dispone de hasta 600 para llevar a cabo la estimacin, cuntas
empresas de cada tipo tiene que observar para conseguir que sea mnimo el error de
estimacin asociado?

SOLUCIN:
La asignacin que minimiza la cota del error de estimacin para un coste fijo es la
asignacin ptima.

17

Usamos que R4 y por tanto estimamos que


Ni

ci

100 16
500 9
700 4
600 = 16n1 + 9n2 + 4n3

Ri

ci

4
3
2

R
.
4
N i i
ci

600-400 50
360-240 30
130-70 15

1250 01087
5000 04348
5250 04565
11500
1
600 = 17392n + 39132n + 1826n = 74784n

( ni = in )

n = 600/74784 = 80231

n1 = 1n = 872 8

n2 = 2n = 3488 34 n3 = 3n = 3663 36

C = (168) + (934) + (436) = 578 < 600

pero

C = (169) + (935) + (437) = 607 > 600


4.

En una poblacin compuesta por aproximadamente igual nmero de hombres que de


mujeres se desea estimar el gasto medio mensual por habitante en ocio. Se lleva a cabo la
encuesta por telfono mediante una muestra aleatoria simple de 500 nmeros de telfono
del citado municipio. Despus de obtenidos los datos se observa que slo 100 de los
encuestados fueron hombres y el resto mujeres. Por ello se decide llevar a cabo una
estratificacin despus de seleccionar la muestra obtenindose los siguientes datos
Ni

HOMBRES
2.500

MUJERES
2.700

ni

100

400

yi

120

250

9.000
16.000
Si2
Estime la media poblacional de gasto mensual en ocio y su cota de error, mediante
muestreo aleatorio estratificado despus de seleccionar la muestra.

SOLUCIN:
Ni
ni
2.500
2.700
5.200

Si2

yi

100
400
500

120
250

9.000
16.000

y st =
1
V ( y st ) = 2
N

Ni y i

1
N

300.000
675.000
975.000

N y
i =1

2
i

0,96
0,85185

N i2

Si2 N i ni
ni N i
540.000.000
248.399.460
788.399.460

975.000
= 187, 5
5.200

Si2 N i ni 788.399.460
N
=
= 29,16

ni N i
5.2002
i =1
L

N i ni
Ni

2 29,16 = 10,8

18

5.

En una poblacin compuesta por aproximadamente igual nmero de hombres que de


mujeres se desea estimar la proporcin de individuos que ven un determinado programa
de televisin. Se lleva a cabo la encuesta por telfono mediante una muestra aleatoria
simple de 300 nmeros de telfono. Despus de obtenidos los datos se observa que slo
50 de los encuestados fueron hombres y el resto mujeres. Por ello se decide llevar a cabo
una estratificacin despus de seleccionar la muestra obtenindose los siguientes datos
HOMBRES
MUJERES
Encuestados
50
250
Ven el programa
12
130
Estime la proporcin de la poblacin que ven el programa de televisin y su cota de error,
mediante muestreo aleatorio estratificado despus de seleccionar la muestra.
SOLUCIN:
12
= 0, 24
50

p1 =

p st =

1
N

i =1

i =1

Ni pi =

p2 =

130
= 0,52 q i = 1 p i
250

Ni
p i = ( 0, 50 0, 24 ) + ( 0,50 0,52 ) = 0,38 p st = 38%
N

N i ni
=1
Ni
2
L
L
1 L 2 p i q i N i ni
1 L 2 p i q i
N i2 pi q i
N i pi q i
V ( p st ) = 2 N i
= 2 Ni
=
=
=
N i =1
ni 1 N i
N i =1
ni 1 i =1 N 2 ni 1 i =1 N ni 1
0, 24 0, 76

2 0,52 0, 48
= 0,502
+ 0,50
= 0, 0011812146
49
249

Si

2 V ( p st ) = 0, 0687 6,87%

6.

Una corporacin desea estimar el nmero total de horas perdidas debido a accidentes de
sus empleados, en un determinado mes. Ya que los obreros, tcnicos y administrativos
tienen diferentes tasas de accidentes, la corporacin decide usar muestreo estratificado,
formando con cada grupo un estrato. Datos de aos previos sugieren las cuasivarianzas
mostradas en la siguiente tabla para el nmero de horas perdidas por empleado en los tres
grupos, y de datos actuales se obtienen los tamaos de los estratos. No habiendo
diferencia entre los costes de observacin de cada grupo, determine la mejor asignacin
para una muestra de 40 empleados.

19

Obreros

Tcnicos

Administrativos

Si2

36

25

Ni

132

92

27

SOLUCIN:
Ni
132

i Si

N i i
792

i
792

1.333

= 0,5941

= 0,3451
1.333
81
= 0, 0608
27
3
81
1.333
1.333
1
Donde se ha aplicado la asignacin de Neyman al ser los costes de observacin iguales:
92

j =

N j j

N
i

460

460

n1 = 40 0,5941 = 23,8 24
n2 = 40 0, 3451 = 13,8 14

i =1

7.

n3 = 40 0, 0608 = 2, 4 2

n = 40

Se dispone de la siguiente informacin sobre tamaos poblacionales de los estratos, costes


de observacin y estimaciones de las proporciones
Tamao del estrato Coste de observacin Proporciones en %
ESTRATO 1
5000
9
90
ESTRATO 2
2000
25
55
ESTRATO 3
3000
16
70
Determine la mejor asignacin para una muestra de 200 observaciones.
SOLUCIN:
Ni

ci

q i

pi

p i q i

N i p i q i
ci

5.000

0,90

0,10

0,3

500

2.000

0,55

0,45

0,4975

199

3.000

0,70

0,30

0,45826

343,695
1.042,695

500

1.042, 695

= 0, 4795

= 0,1909
1.042, 695
343, 695
= 0,3296
1.042, 695
1
199

Donde se ha aplicado la asignacin ptima:


Nj

j =

N
i =1

8.

p jq j

n1 = 200 0, 4795 = 95,9 96

cj

n2 = 200 0,1909 = 38, 2 38

pi qi
ci

n3 = 200 0,3296 = 65,9 66


n = 200

La produccin de piezas de una factora se realiza en dos mquinas. El 40% de las piezas
las produce la mquina A y el 60% restante la mquina B. Se les pas control de calidad a
200 piezas; 67 producidas por la mquina A y dos de ellas resultaron defectuosas; las 133
restantes procedan de la mquina B, siendo 6 de ellas defectuosas. Estimar la proporcin
de piezas defectuosas de la factora y dar el lmite de error de estimacin. Omita el
coeficiente corrector por poblacin finita.

20

SOLUCIN:

p=

Estrato

Ni

ni

pi

A
B

0.40 N
0.60 N
N

67
133
200

2/67=0.030
6/133=0.045

p i q i
ni 1
0.000441
0.000326

1
( ( 0.40 N 0.030 ) + ( 0.60 N 0.045) ) = ( ( 0.40 0.030 ) + ( 0.60 0.045) ) = 0.039
N

( )

( 3.9% )

1
0.402 N 2 0.000441) + ( 0.602 N 2 0.000326 ) =
2 (
N
= ( 0.402 0.000441) + ( 0.602 0.000326 ) = 0.000188

V p =

B = 2 0.000188 = 0.0274
9.

( 2.74% )

Para la comercializacin de un producto se le clasifica, atendiendo al calibre, en tres


categoras: pequea, mediana y grande. Un establecimiento dispone de 300 piezas
pequeas, 500 medianas y 200 piezas grandes. Para estimar el peso total de producto
almacenado se decide tomar una muestra aleatoria que contenga piezas de todas las
categoras, resultando
Categora N de piezas Peso en gramos
Pequea 5
12, 14, 12, 15, 12
Mediana 6
16, 22, 24, 20, 20, 18
Grande
4
30, 33, 31, 34
Considerando los anteriores datos como una muestra previa, obtenga el nmero de
unidades que cada categora debe aportar a la muestra para que el error en la estimacin
del peso total no supere el medio kilo.

SOLUCIN:
Peso en gramos

(con las funciones del modo SD de la calculadora )

12, 14, 12, 15, 12

S1 = 1, 4142

S12 = 2

16, 22, 24, 20, 20, 18 S 2 = 2,8284

S 22 = 8

30, 33, 31, 34

21

S3 = 1,8257

S32 = 3, 3333

Ni

N i i

2
i

N i

j =

2
i

N j j
i =1

300
500
200

1,4142
2,8284
1,8257

2
8
3,3333

N = 1000

424,26
1414,2
365,14

600
4000
666,66

2203,6

5266,66
n=

13, 79 14
45,99 46
11,87 12
n = 72

( N )
i =1

0,1925
0,6418
0,1657

B2
250.000
D=
=
= 0, 0625
2
4N
4.000.000

ni = 71, 66i

= 71, 66

N D + N i
2

i =1

2
i

10. Una inspectora de control de calidad debe estimar la proporcin de circuitos integrados de
ordenador defectuosos que provienen de dos diferentes operaciones de ensamble. Ella
sabe que de entre los circuitos integrados que van a ser inspeccionados, 60% procede de
la operacin de ensamble A y 40% de la operacin de ensamble B. En una muestra
aleatoria de 100 circuitos integrados resulta que 20 provienen de la operacin A y 80 de la
operacin B. De entre los circuitos integrados muestreados de la operacin A, 2 son
defectuosos. De entre las piezas muestreadas de la operacin B, 16 son defectuosas.
a. Considerando nicamente la muestra aleatoria simple de 100 circuitos
integrados, estime la proporcin de los defectuosos en el lote, y establezca un
lmite para el error de estimacin.
b. Estratifique la muestra, despus de la seleccin, en circuitos integrados
provenientes de la operacin A y B, estime la proporcin de los defectuosos en
la poblacin, y fije un lmite para el error de estimacin.
c. Qu respuesta encuentra ms aceptable? Por qu?

SOLUCIN:
a. p =

18
pq
= 0,18 (18%) V ( p ) =
= 0, 001491 2 V ( p ) = 0, 0772
100
n 1

b. p st =

1
N

i =1

i =1

Ni pi =
1
V ( p st ) = 2
N

Ni
2
16

p i = 0, 60 + 0, 40 = 0,14
N
20
80

L
L
p i q i N i ni
N i2 p i q i
N
=
=

2
ni 1 N i
i =1
i =1 N ni 1
i =1

= ( 0, 60 )

2
i

( 7, 72% )

(14% )
2
N i p i q i
=

N ni 1

0,10 0,90
2 0, 20 0,80
+ ( 0, 40 )
= 0, 00203
19
79
2 V ( p st ) = 0, 0901

( 9, 01% )
22

c. Aunque en el conjunto de la poblacin hay ms elementos que proceden de A (60%)


que de B (40%), la muestra global no representa adecuadamente este hecho,
predominando los elementos de B (80) frente a los de A (20), esto ocasiona que en el
apartado a. la estimacin est sesgada hacia el valor de B ( p 2 = 0, 20 ) frente al de A
( p1 = 0,10 ). En el apartado b.

este hecho se corrige dando a p1 y p 2 las

ponderaciones 0,60 y 0,40 respectivamente para estimar p.

12. Una cadena de restaurantes tiene 100 establecimientos en Madrid, 70 en Barcelona y 30


en Sevilla. La direccin est considerando aadir un nuevo producto en el men. Para
contrastar la posible demanda de este producto, lo introdujo en el men de muestras
aleatorias de 10 restaurantes de Madrid, 5 de Barcelona y 5 de Sevilla. Usando los ndice
1, 2 y 3 para designar Madrid, Barcelona y Sevilla, respectivamente, las medias y las
desviaciones tpicas muestrales del nmero de pedidos de este producto recibidos por
restaurante en las tres ciudades durante una semana fueron:
y1 = 21, 2

S1 = 12

y2 = 13, 3

S 2 = 11

y3 = 26,1

S3 = 9

a. Estimar el nmero medio de pedidos semanales por restaurante para los


restaurantes de la cadena. Dar un lmite del error de estimacin.
b. Determinar el tamao muestral y la asignacin para repetir el estudio anterior
cometiendo un error inferior a 3 pedidos.
SOLUCIN:
a. y st =
V ( y st ) =

1
N

N y
i

i =1

1
N2

Ni2
i =1

3834
= 19,17 pedidos / semana
200

Si2 N i ni
= 6, 2965
ni N i

2 V ( y st ) = 5, 02 pedidos / semana

b.
Ni

2
i

N i i

N i

2
i

j =

N j j

N
i =1

100
70
30
N = 200

23

12
11
9

144
121
81

ni = 43, 52i

1200
770
270

14400
8470
2430

0,5357
0,3438
0,1205

2240

25300

23, 31 24
14,96 15
5, 24 6
n = 45

( N )
L

D=

B2 9
= = 2, 25
4 4

n=

i =1

= 43,52

N D + N i
2

i =1

2
i

13. De una ciudad con 350 casas, se sabe que 164 de ellas tienen calefaccin elctrica. Al
realizar una encuesta sobre el consumo de energa (en kilovatios-hora) se obtuvieron los
siguientes resultados:
Tipo Calefaccin N casas Media muestral Cuasivarianza muestral
Elctrica
24
972
202,396
No elctrica
36
463
96,721
a. Obtenga una estimacin del nmero medio de kilovatios-hora utilizado en la
ciudad. D un lmite para el error de estimacin.
b. Obtenga una estimacin del nmero medio de kilovatios-hora utilizado por las
casas que no tienen calefaccin elctrica. D un lmite para el error de
estimacin.
SOLUCIN:
a.
Ni

164
186
350

ni

24
36

Si2

yi
972
463

202,396
96,721

y st =

V ( y st ) =

Ni y i

1
N2

1
N
L

N y
i

i =1

Ni2
i =1

159.408
86.118
245.526

N i ni
Ni

0,854
0,806

Si2 N i ni
N
ni N i
193.699,13
74.925,32
268.624,45
2
i

245.526
= 701, 50
350

Si2 N i ni 268.624, 45
=
= 2,19
ni N i
3502

2 2,19 = 2,96

b.

y 2 = 463
V ( y2 ) =

S 22 N 2 n2 96, 721 186 36


=
= 2,17
n2 N 2
36
186
2 2,17 = 2, 94

24