Professional Documents
Culture Documents
ESTIMADORES DE RAZN
_____________________
__________________________________________________________________________
En los captulos anteriores tratamos el problema de cmo disear la muestra ms eficiente (desde
el punto de vista de minimizar el error) usando toda la informacin relevante que se pueda
obtener de la poblacin. Hemos visto cmo usar informacin para la estratificacin, ya sea con
asignacin proporcional o asignacin ptima, cmo tomar en cuenta los costos unitarios, y cmo
escoger entre diferentes clases de unidades de muestreo. Hemos visto cmo usar cualquier
conocimiento que tengamos sobre los costos y las varianzas de diferentes mtodos de muestreo a
fin de producir la cantidad mxima de informacin con los recursos que tenemos disponibles.
Todo este anlisis ha sido en trminos de estimaciones bastante simples como en las
cuales las estimaciones fueron elaboradas usando solamente los datos de la muestra, el nmero
total de unidades (N) de la poblacin y las probabilidades de seleccin. As, para el muestreo
aleatorio simple,
Pero hay mtodos ms complejos para estimar estas estadsticas que, bajo ciertas circunstancias,
pueden proporcionar grandes reducciones en los errores.
Adems, hay otros tipos de estadsticas de gran inters, tales como el cociente entre dos
165
variables, cambios cronolgicos en una sola caracterstica, etc. Por ejemplo, podemos obtener
informacin sobre sueldos y sobre el nmero de horas trabajadas, pero tal vez nos interese ms
estimar los ingresos promedios por hora, en vez del total de sueldos o el total de horas trabajadas.
De las encuestas que cubren dos perodos diferentes de tiempo, tal vez nos interese ms saber si
los sueldos totales han aumentado o disminuido, que saber el nivel de los mismos. El anlisis de
los errores de las razones estimadas tambin ayuda con el problema de producir estimaciones
ms eficientes de las medias y los totales.
(11.1)
11.2.1 Razn Entre la Misma Caracterstica o Entre Una Caracterstica y Otra Afn en
un Perodo de Tiempo Anterior
Y y X son dos caractersticas diferentes para el mismo perodo de tiempo, y se sabe que estn
positivamente correlacionadas. El verdadero valor del agregado X es conocido. Por ejemplo,
para la isima explotacin en una muestra, xi puede ser el total de hectreas en las explotaciones, e
yi los pagos por concepto de mano de obra; el nmero total de hectreas en todas las
explotaciones X, es conocido a partir de una fuente distinta. Si, en general, las explotaciones ms
grandes pagan ms en sueldos totales por mano de obra que las ms pequeas, el estimador de
razn puede reducir drsticamente el error muestral. En esta aplicacin, la encuesta se usa para
medir una tasa (tal como el pago promedio por hectrea) que se multiplica por el nmero
167
conocido de hectreas.
una constante cuyo valor se conoce para toda la poblacin. Por lo tanto, un anlisis del error
(11.2)
(11.2a)
(11.3) =
(11.3a)
(11.3b)
Las ecuaciones (11.2) y (11.3) son algo ms sencillas si se expresan en trminos del coeficiente
de variacin, CV. El cuadrado del coeficiente de variacin (esto es, la varianza relativa)
169
(11.4)
entre y y se usa el smbolo para representarla. Puede ser calculado exactamente como la
dondequiera que ocurra. Por lo tanto, para el muestreo aleatorio simple tenemos
(11.5)
donde
(11.6)
(11.7)
directamente de
(11.8)
Para una muestra estratificada, con las estimaciones de totales dadas por y
(11.9)
Si examinamos la ecuacin (11.4), la frmula para la varianza relativa de una estimacin de total,
(11.4)
y es aproximadamente igual a 1.
Adems, habr una correlacin muy alta entre Y y X, probablemente alrededor de 0,90 o 0,95.
Consecuentemente, el uso de un estimador de razn resultar en un beneficio substancial en la
exactitud. La cantidad del beneficio puede conseguirse como sigue: si la
ecuacin (10.4) se convierte en
y si = 0,90, tenemos
Dicho de otra forma, el uso del estimador de razn logra una reduccin de 80 porciento en la
varianza. Si = 0,95, es igual a y la reduccin es de un 90
porciento. Viendo el resultado de otra manera, el estimador de razn es tan efectivo como el usar
una muestra 5 veces (o 10 veces) ms grande.
dichos casos, la correlacin es probablemente bastante baja, a no ser que sea bastante
grande--por ejemplo, mayor que . En la prctica, si es menor que 20 porciento, el uso del
eficiencia; mientras ms cercana a 100 porciento, mayor la mejora. Entre 20 y 40 porciento, las
diferencias entre los dos tipos de estimaciones sern pequeas. Entonces, por ejemplo, en una
encuesta de fuerza de trabajo, el uso de estimadores de razn probablemente ofrece una mejora
importante en la estimacin del nmero de empleados (el cual comprende una proporcin
bastante alta de la poblacin adulta) pero probablemente resulta en un leve aumento en el error
estndar de la estimacin de los desempleados.
El estimador de razn nos da una estimacin sesgada. Esto se puede demostrar fcilmente
construyendo una poblacin pequea con los valores Yi y Xi para cada elemento, tomando todas
las muestras posibles de dos o tres elementos, y calculando para cada muestra. Se notar
que el promedio de las razones no es el verdadero promedio. Sin embargo, el sesgo tiende a ser
despreciable para muestras moderadamente grandes. En la mayora de las aplicaciones prcticas,
el sesgo es tan pequeo comparado con la ventaja obtenida en la reduccin del error muestral,
que el estimador de razn es preferible a la estimacin insesgada.
Un estimador de razn, aunque sesgado, es una estimacin consistente. Esto significa que, si
usamos una muestra suficientemente grande, podemos estar seguros de que la estimacin estar
tan cercana al valor verdadero como lo deseamos. No slo disminuye el error al aumentar el
tamao de muestra, sino que tambin se reduce el sesgo.
Para muestras razonablemente grandes, los estimadores de razn siguen una distribucin normal
(para los tipos de poblaciones que se encuentran en la prctica). Por consiguiente, si calculamos
el error del estimador de razn, podemos construir el mismo tipo de lmites de confianza para
173
y que para y esto es, podemos decir que tenemos una posibilidad de 68
Las secciones 11.3.3 a 11.3.5 se refieren al hecho de que se necesitan muestras moderadamente
grandes para que el sesgo sea despreciable, y para que las estimaciones muestrales sigan una
distribucin razonablemente normal. Cundo es suficientemente grande la muestra? La
siguiente regla ha sido sugerida: si el tamao de muestra sobrepasa 30 y si los coeficientes de
variacin de y son ambos menos del 10 porciento, entonces el sesgo es despreciable y
podemos suponer que se cumplen los requisitos de la teora de la distribucin normal. La
primera condicin no significa que un estimador de razn sea necesariamente mejor que una
estimacin simple insesgada siempre que n > 30; significa que este tamao de muestra es
requerido antes de que las frmulas para el error muestral puedan tener el significado habitual en
trminos de intervalos de confianza.
sesgo es
Aun con valores bajos de esto ser pequeo comparado con el error estndar de siempre y
cuando la muestra sea razonablemente grande para que sea pequeo.
Estas frmulas de sesgo se presentan para fines de anlisis. Nunca se usan para ajustar las
estimaciones. En las situaciones donde se espera que el sesgo sear significativamente grande, se
174
11.3.9 Ilustracin
Supongamos que un censo completo del valor de envos se realiz en 1981. El cuadro siguiente
muestra el valor de cada envo en una muestra aleatoria simple del valor de 10 envos extrada de
los valores de 30 envos. El problema es estimar el valor total de envos en 1982. Se conoce el
verdadero total de 1981 total, X, y este valor asciende a $19,5 mil millones.
Valor de los
cargamentos en 1981 0 1.1 0.5 0.4 1 0.7 0.2 0.3 2.4 0
(xi)
Valor de los
cargamentos en 1982 0 0.6 0.8 0.6 1 0.8 0.9 0.8 2.7 0
(yi)
Tenemos,
N = 30, n = 10
1
Para otros mtodos de estimacin, vase la seccin 2 del captulo 11 de Mtodos y Teora de Encuestas por
Muestra (referido en la nota de pi del captulo 8).
175
(1)
(2)
(3)
(4)
(1)
(2)
(3)
(4)
Trabajo Prctico - 11
Problema A: Una muestra aleatoria simple de 10 porciento de las unidades de vivienda de una aldea ha sido
seleccionada produciendo las 12 unidades de vivienda listadas a continuacin. De cada unidad
muestral, se obtuvo informacin sobre el nmero de personas en el hogar y el total anual de ingresos;
los resultados aparecen a continuacin. Tambin se sabe de fuentes independientes que la poblacin
total de todos los hogares de la aldea es de 600 personas.
Ejercicio 1. Estime los ingresos totales de todos los hogares de la aldea usando un factor de expansin directo.
Ejercicio 2. Estime los ingresos totales de todos los hogares de la aldea usando un estimador de razn.
Ejercicio 3. Use los resultados muestrales para estimar el coeficiente de variacin para cada una de las
estimaciones precedentes.
Problema B: El cuadro siguiente muestra el total de hectreas en tres explotaciones junto con los pagos por
concepto de mano de obra, extrado de 30 explotaciones. Se supone que el verdadero valor del total
de hectreas de todas las explotaciones, X, sea 800.
178
Estimador de Razn
1. Un agente forestal est interesado en estimar el volumen total de arboles en una venta de madera. El agente
registra el volumen de cada arbol tomando una muestra aleatoria simple. Adems, mide el rea de la base de
cada rbol marcado para la venta. Luego, utiliza un estimador de razn para el volumen total.
El agente decide tomar una muestra aleatoria simple de n = 12 a partir de N = 250 rboles marcados para la
venta. Que x denote el rea de la base e y volumen en pies cbicos del rbol. El rea total de las bases de los
250 rboles, Tx, es 75 pis cuadrados. Utilice los datos ms abajo para estimar Ty, el volumen total en pis
cbicos para los rboles marcados para la venta y encuentre el error.
2. Utilice los datos del ejercicio 1 para calcular la estimacin de Ty usando el estimador
. Encuentre el error y compare los resultados con los del ejercicio anterior.
3. Se llev a cabo una encuesta de consumidores para determinar el cociente entre el dinero que se gast en
comida y el ingreso total de los hogares de una cierta comunidad pequea. Se seleccion una muestra
aleatoria simple de 14 hogares a partir de los 150 hogares de la comunidad. Los datos de la muestra se
presentan ms abajo. Estimar la razn poblacional R, y encontrar el error.
1 5,010 990
2 12,240 2,524
3 9,600 1,935
4 15,600 3,123
5 14,400 2,760
6 6,500 1,337
7 8,700 1,756
8 8,200 2,132
9 14,600 3,504
10 12,700 2,286
11 11,500 2,875
12 10,600 2,226
13 7,700 1,463
14 8,500 1,905
=145,850 = 30,816
180
4. Una corporacin est interesada en estimar los ingresos totales de las ventas de televisores a color al fin de
un perodo trimestral. Se tienen los ingresos disponibles para todos los distritos dentro de la corporacin
para el perodo trimestral correspondiente al ao anterior. Se saca una muestra aleatoria simple de 13
oficinas de distrito a partir de las 123 oficinas dentro de la corporacin. Usando el estimador de razn,
estimar Ty y encontrar el error. Utilice los datos de la tabla ms abajo y suponga que Tx = 128,200.
5. Utilice los datos del ejercicio anterior para estimar el promedio de ingresos para las oficinas dentro de la
corporacin. Encuentre el error de estimacin.
6. Un investigador tiene una colonia de N = 763 ratas que han sido sometidas a una cierta droga. El tiempo
promedio para llegar de la entrada a la salida del laberinto correctamente bajo la influencia de la droga
estndar es de x = 17.2 segundos. El investigador ahora quiere tomar una muestra de 11 ratas y someterlas a
una nueva droga. Estimar el tiempo promedio para cruzar el laberinto bajo la influencia de la nueva droga.
Encuentre el error de estimacin. (Ayudita: es razonable usar el estimador de razn para la media si se
supone que las ratas reaccionarn a la nueva droga de la misma manera que reaccionaron a la droga estndar).
7. Un grupo de 100 conejos se est utilizando para llevar a cabo un estudio de nutricin. Se toma el peso de
cada conejo antes del estudio. El promedio de estos pesos es 3.1 libras. Despus de dos meses, el
investigador quiere obtener el peso promedio aproximado de los conejos. Selecciona n = 10 conejos
aleatoriamente y los pesa. El peso original y el actual se presentan ms abajo:
181
Conejo 1 2 3 4 5 6 7 8 9 10
Peso 3.2 3.0 2.9 2.8 2.8 3.1 3.0 3.2 2.9 2.8
Original
Peso Actual 4.1 4.0 4.1 3.9 3.7 4.1 4.2 4.1 3.9 3.8
8. Un trabajador social quiere estimar la razn entre el nmero promedio de cuartos por apartamento y el
nmero promedio de personas por apartamento dentro de un barrio urbano. Selecciona una muestra aleatoria
simple de 25 apartamentos a partir de los 275 en el barrio urbano. Que xi denote el nmero de personas en el
apartamento i y que yi denote el nmero de cuartos en el apartamento i. De un recuento del nmero de
cuartos y del nmero de personas en cada apartamento, se obtuvieron los siguientes datos:
Estimar la razn entre el nmero promedio de cuartos y el nmero promedio de personas en el barrio urbano
y encontrar el error de estimacin.
9. Un gerente de recursos forestales est interesado en estimar el nmero de rboles de cedro muertos en una
rea de 300 acres de infeccin severa. Usando fotografa area, divide el rea en 200 parcelas de 1.5 acres.
Que x denote el recuento fotogrfico de los cedros muertos y que y denote el recuento en tierra actual para
una muestra aleatoria simple de 10 parcelas. El nmero total de cedros muertos obtenido por fotografa area
es Tx = 4,200. Use los datos de la muestra ms abajo para estimar Ty, el nmero total de cedros muetos en el
rea de 300 acres. Encuentre el error de estimacin.
10. Los miembros de una asociacin de maestros estn preocupados por el aumento de salarios que se les
otorg a los maestros de escuela secundaria de un cierto sistema escolar. Se saca una muestra aleatoria
simple de 15 maestros a partir de una lista alfabtica de todos los maestros de escuela secundaria en el
sistema. Se entrevistan a los 15 maestros para determinar sus salarios para este ao y el anterior. Use
estos datos para determinar R, la tasa de cambio, para los 750 maestros de escuela secundaria en el
sistema escolar. Encuentre el error de estimacin.