You are on page 1of 14

Pontificia Universidad Catlica de Chile Facultad de Ciencias Econmicas y Administrativas

Ejemplo resueltos N1 Ejemplo 1

EAS-201A Semestre II 2006 Profesor: Vctor Correa S.

Supn que 15.000 personas de una ciudad con 500.000 habitantes estn viendo cierto programa de televisin. Si se entrevistan a una muestra aleatoria simple de 200 personas de la ciudad, cul es la probabilidad de que menos de cuatro personas estn viendo el programa? a) Calcula la probabilidad exacta. b) Utiliza la aproximacin del TLC. Solucin
Sean las variables aleatorias, X1, X2, . . . , X200, donde, Xi = 1 si en la i-sima extraccin, la persona seleccionada est viendo el programa, 0 si no. Dado que se dice que es una muestra aleatoria, las variables anteriores, deben ser independientes (es decir las extracciones son con reemplazo) con la misma distribucin Bernoulli, Xi B(), donde = proporcin en el universo de las 500.000 personas que estn viendo el programa = 15.000/500.000 = 0,03. Se pide Pr[X1 +X2 +. . . + X200 < 4 ] = Pr[X1 +X2 +. . . + X200 3 ]. a) Dado que, X1 +X2 +. . . + X200 B( n= 200; = 0,03 ), la probabilidad exacta es p(0)+ p(1) + p(2) +p(3), donde:

200 x 200 x p( x) = . x (0,03) (0,97)


Resulta Pr[X1 +X2 +. . . + X200 3 ] = 0,1472.

b) Usando el TLC,

X a N ( ;

(1 ) 0,03 0,97 ) = N (0,03; ) = N (0,03 ; (0,0121) 2 ) n 200

podemos obtener la probabilidad aproximada: Pr[X1 +X2 +. . . + X200 3 ] = Pr[ X 3/200 = 0,015) ( ( 0,015 0,03) / 0,0121 ) = ( ( 1,24) = 0,1075. Con la correccin por continuidad, resulta una aproximacin mejor: Pr[ X (3 + 0,5)/200 = 0,0157) ( ( 0,0175 0,03) / 0,0121 ) = ( ( 1,03) = 0,151.

Ejemplo 2 Se selecciona una muestra aleatoria de 16 observaciones de una distribucin normal con media y desviacin estndar 12 y que se selecciona independientemente otra muestra aleatoria de 25 observaciones de una distribucin normal con la misma media y

desviacin estndar 20. Sean Calcula Pr[ X - Y < 5]. Solucin

X y Y las medias muestrales de las dos muestras.

Dado que se trata de muestras aleatoria, X1, X2, . . . , X16, son iid N( , 122 ) y Y1, Y2, . . . , Y25, son iid N( , 202 ). Por lo tanto,

X N( , 122/16) y Y N( , 202/25). Como las muestras son


As,

independientes, entonces, las variables anteriores son tambin independientes y por lo tanto se tiene,
2 2 2 2 2 X - Y N( - , 12 /16 +20 /25) = X - Y N( 0 , 12 /16 +20 /25) = N( 0, 5 ).

Pr[

X - Y < 5] = Pr[ -5 < X - Y < 5 ] = - Y - 0)/5< (5 0)/5) ] = Pr[ -1 < Z < 1 ] = (1,0) - (-1,0) = 0,68.

Pr[( -5 0)/5 < ( X

Ejemplo 3 Se va a seleccionar una muestra aleatoria de tamao n de una distribucin normal con media y varianza 2 = 9. Determina el valor de n para el cual Pr[ X - < 1] 0,95. Solucin
2 X N( , 3 /n). Entonces:

Pr[ X - < 1] = Pr[-1 < X - < 1] = Pr[-1/(3/ n ) < ( X -)/(3/ n ) < 1/(3/ n )] = ( n /3 ) - (- n /3 ) = 2 ( n /3 ) 1 0,95. As, n /3 1,96, n 35. Ejemplo 4 Un sondeo pregunta a una muestra aleatoria simple con reemplazo de 1.100 adultos varones, juegas ftbol? Supn que el 12% de todos los adultos varones de Santiago juegan ftbol. a) Halla la media y error estndar del estadstico: P = proporcin de personas en la muestra que juega ftbol. b) Cul es la distribucin en el muestreo aproximada de P? c) Halla la probabilidad de que entre el 10% y 14% de la muestra juegue ftbol. d) Qu tamao de muestra se precisara para reducir el error estndar de la proporcin muestral a la mitad del valor que hallaste en a)? Solucin
a) P = proporcin en la muestra de varones que juegan ftbol. E(P) = =0,12; Error estndar de P = ee(P) = Raiz( (1- )/1100) = Raiz(0,12 (1- 0,12 )/1100) = 0,010.

b) Por el TLC, para n = 1100, P tiene una distribucin aproximadamente normal con media 0,12 y varianza (0,010) 2. c) d) De b), Pr(0,10 < P < 0,14) = ( (0,14-0,12)/0,010 ) - ( (0,100,12)/0,010 ) = ( 2,00 ) - ( -2,00 ) = 0,9772 0,0228 = 0,9544.

e)

Se busca n tal que ee(P) = Raiz(0,12 (1-0,12 )/n) = 0,010/2 = 0,005. Despejando se obtiene, n = 4.224 varones adultos.

Ejemplo 5 Una compaa de TV por cable que da servicio a 1.200.000 hogares, aplica una encuesta a una muestra aleatoria simple de 100 hogares. El nmero medio de horas que los hogares de la muestra utilizan el servicio result 3,8 horas diarias con una desviacin estndar de 2,11. a) Describe los parmetros, estimadores y estimaciones, implcitos en el enunciado anterior. Explica dos propiedades de uno de los estimadores y porque son tiles para estimar el parmetro. La compaa cree que el nmero medio de horas al da que utilizan el servicio los 1.200.000 hogares es 4,5 y la desviacin estndar 2,00. Suponiendo que la compaa tiene razn, se pide:
b)

Encuentra la distribucin asinttica del promedio de horas al da en una muestra aleatoria simple de 100 hogares. Explica cmo se interpreta la distribucin anterior y la relacin con el valor 3,8. Calcula la probabilidad de que el promedio de horas del servicio utilizada por los hogares, en una muestra aleatoria simple 100 hogares, resulte menor que 4,0 horas.

c)

Solucin
a) Parmetros: = nmero medio de horas al da que los 1.200.000 hogares utilizan el servicio de TV Cable. 2 = desviacin estndar del n de horas al da que los 1.200.000 hogares utilizan el servicio de TV Estimadores: Y = nmero medio de horas al da que los hogares de la muestra utilizan el servicio de TV Cable

S2 = desviacin estndar del n de horas al da que los hogares de la muestra utilizan el servicio de TV. 3,8 y 2,11 son estimaciones de y 2 respectivamente. El estimador Y es insesgado y consistente con respecto a . Es decir, su media es y su error estndar o varianza tiende a cero cuando el tamao de la muestra tiende a infinito. Lo anterior significa que para una muestra grande como la de este ejemplo n = 100 > 30, la estimacin 3,8 estar prxima a . b) Por el TLC la distribucin asinttica de Y es, 100 > 30, = 4,5; 2 = (2,00)2 = 4,00. La distribucin anterior, representa el histograma de frecuencias del n de horas promedio Y , en infinitas muestras aleatorias simples de n = 100, seleccionadas desde la poblacin de 1.200.000 hogares. (0,7 ptos) El valor 3,8 es uno de los promedios anteriores.

~ N ( ,

2 ) = N (4,5; 0,04) dado que n = n

Aqu un grfico puede valer ms que mil palabras: c) Se pide Pr( Y < 4,0) usando la distribucin de Y , se tiene que, Pr( Y < 4,0) ( (4,0 4,5)/0,2 ) = (-2,5) = 0,0062.

Ejemplo 6 Un indicador de la salud financiera de una empresa es el cuociente, A/P, entre su activo y pasivo. Se planea seleccionar muestras aleatorias independientes X 1 ,..., X n1 , Y1 ,..., Yn 2 de n1 empresas quebradas y n2 empresas sin problemas respectivamente. Suponiendo que ambas poblaciones se distribuyen normalmente con medias 1 y 2 2 respectivamente y varianzas iguales, 2 = 12 = 2 se pide: Encuentra un estimador insesgado para la diferencia de los A/P promedios, = 1 2 y su distribucin muestral. b) Se propone el siguiente estimador para la varianza:
a)

n1 i =1

( X i X ) 2 + j =1 (Y j Y ) 2
n2

n1 + n 2

Demuestra que el estimador anterior es sesgado

y sugiere, a partir de ste, un estimador insesgado. c) Se observaron los A/P correspondientes en los balances del ao anterior en dos muestras del mismo tamao n1 = n2 = 10 y se obtuvieron los siguientes resultados: Media Varianza Sin Problemas Quebradas 1,026 0,786 0,356 0,311

Obtenga una estimacin de y del error estndar del estimador. Un experto afirma que el hecho que > 0, no significa, necesariamente, que en la poblacin, el promedio de las empresas sin problemas sea mayor que el promedio de las quebradas. Explique la afirmacin anterior. Solucin
a) Estimador insesgado de = 1 - 2,

= Xbarra - Ybarra.

El estimador es insegado porque tanto Xbarra como Ybarra son estimadores insesgados de 1 y 2 respectivamnete, entonces: E( ) = E(Xbarra) - E(Ybarra) = 1 - 2 = . Se tiene que en el muestreo: Xbarra Normal(1 , 2 /n1) y Ybarra Normal(2 , 2 /n2) Entonces, dada la independencia de las muestras se tiene que Normal(1 -2 , 2 (1/n1+1/n2) ) b)

E (

)=

n1 i =1

E ( X i X ) 2 + j =1 E (Y j Y ) 2
n2

n1 + n 2

( n1 1) 2 + (n 2 2) 2 ( n1 + n 2 2) 2 = 2 as, 2 es sesgado. n1 + n 2 n1 + n 2 Claramente, para que sea insesgado, el denominador de 2 debe cambiarse por n1 + n2 2, as un E ( 2 ) =
nuevo estimador insesgado de la varianza es:


c)

2 P

n1

i =1

( X i X ) 2 + j =1 (Y j Y ) 2
n2

n1 + n 2 2

2 ( n1 1) S12 + ( n 2 1) S 2 = n1 + n 2 2

Estimacin de : Error estandar de

= Xbarra - Ybarra. = 1,026 0,786 = 0,24. : ee( )gorro = Raiz(2gorro (1/10+1/10) )

De b), P =
2

9 0,356 + 9 0,311 = 0,3335 10 + 10 2

ee( )gorro = Raiz( 0,3335 (1/10+1/10) ) = 0,26


La estimacin 0,24 es el resultado de un estimador que tiene una fluctuacin aleatoria, de modo que >0 puede ser fruto del azar. Los posibles resultados de estn centrados en pero estn dispersos a la izquierda y derecha. Es decir, por ejemplo, puede ocurrir que en las poblaciones, = 1 - 2 =- 0,05 < 0, pero si repetimos el muestreo, podramos obtener una estimacin como, > 0 en ms de 40% de los casos (1- ( (0 (-0,05))/0,26 ) = 1-0,58 =0,42).

Ejemplo 7 Considere una muestra de tamao n y las distribuciones de tres estimadores de un parmetro : c 2 1 ~ N( + , (1 c)) , n n 2 ~ N( , ) 2 n ~ N( ; 0,01 2 ) 3 0<c<1

a) Comente las propiedades de Insesgamiento y Consistencia de los estimadores anteriores. b) Para que valores de c el primer estimador es mejor que el segundo? c) Para que tamao de muestra el segundo estimador es mejor que el tercero? d) Si usted tuviera que estimar el parmetro cul de los estimadores anteriores usara?. Explique su eleccin.
SOLUCION a) El primer estimador es sesgado pues su media es Su error cuadrtico medio es consistente. El segundo estimador es insesgado y consistente: su valor medio coincide con el parmetro y su varianza 2/n .0 si n .

c n

.
2 2

c Var[1 ] + [E[1 ] - ] 2 = (1 c ) + 0 , si n . n n

As es

El tercer estimador es insesgado pero no consistente, su media es , pero su varianza 0,01 2 0,01 2 0, si n . c) El primer estimador es mejor que el segundo si:

2 c2 2 (1 c) + < n n n
equivalentemente:

c 2 2c < 0

Para solucionar la inecuacin anterior en c, recordemos que la parbola x2 + bx toma valores negativos entre sus ceros es decir, 0 y b, as los valores de c que satisfacen la inecuacin anterior, deben cumplir 0 < c < 2 y 0 <c <1. c) Notar que ambos estimadores son insesgados, as, basta comparar sus varianzas 2 /n y 0,012 respectivamente, que coinciden con los errores cuadrticos medios correspondientes. Claramente, el segundo es peor que el tercero si n < 100, igual si n = 100 y mejor si n>100. d) Depende. Si n < 100 prefiero el tercero. Si n =100 el segundo o tercero da lo mismo. Si n >100 prefiero el segundo. Si n > 100 y sabemos que c < 2, conviene el primero. Si n 100 y c < 2, con la informacin del enunciado no se puede saber si el 1 es mejor que el 3, entonces, es preferible el estimador en 3, que al menos se sabe insesgado.

Ejemplo 8 Sea, Y1 , Y2 , ...., Yn una m.a.s.(n) de Y con media 0, varianza 2 y suponga que el coeficiente de variacin es conocido c = /. Se propone el siguiente estimador de : = wY
a)

donde w es una constante conocida.

Demuestra que para w 1, el estimador propuesto es sesgado y calcula su error cuadrtico medio. b) Muestra que el error cuadrtico medio del estimador propuesto es mnimo cuando w = n/(n+c2) y que en ese caso: ECM ( ) = 2 /( n + c 2 ) c) En el problema de estimar la media de una poblacin cuando el coeficiente de variacin es conocido, qu estimador es mejor Y o .
SOLUCION a)

E[ ] = wE[Y ] = w ECM [ ] = Var[ ] + [ E[ ] ] 2 = w 2


b)

2 + ( w 1) 2 2 n

d 2 ECM [ ] = 2w + 2( w 1) 2 = 0 dw n

w = 2/(2 +2/n) = n/(n+c2) ECM [ ] = (


c) Se debe elegir el estimador que tenga en menor error cuadratico medio, en este caso se tiene que:

n2 2 c2 2 2 2 +( ) = (n + c 2 ) 2 n n + c2 n + c2

ECM [ ] =

2 2 < = Var[Y ] = ECM [Y ] n n + c2

As, dado el coeficiente de variacin poblacional conocido es preferible el estimador propuesto, a pesar que es sesgado y el promedio es insesgado.

Dos moralejas importantes del ejercicio anterior son: 1) un estimador sesgado puede ser preferible a otro insesgado y 2) el conocimiento de informacin adicional (exgena a la muestra) acerca de la poblacin (en este caso el coeficiente de variacin c) es clave para mejorar un mtodo de estimacin. Ejemplo 9 Considere dos muestras aleatorias independientes de tamaos: n = 31 y m=61, X 1 ,..., X 31 Y1 ,...,Y61 de la variables independientes X ~ N( 1 , 2 ) ; Y ~ N( 2 , 2 ) ; respectivamente. A partir de cada muestra se proponen los siguientes estimadores de la varianza 2 : 30 60 2 2 nS X + mS Y 2 a) Demuestre que el estimador S = es mejor que los anteriores. n+m 2 2 2 b) Considere el siguiente estimador de la varianza: S p = S X + S Y . Encuentre las ponderaciones y de modo que el estimador anterior sea insesgado y an mejor que S 2 .
SOLUCION a) De clases (propiedad 1.3.2 y ejemplo 3.1.2), se sabe que ambos estimadores S 2X y S2Y son estimadores insesgados de 2. Ahora, con respecto a S2, se tiene que tambin es insesgado pues:
2 nES X + mES Y2 n 2 + m 2 ES = = = 2 n+m n+m 2

2 X

31 i =1

(X i X )2

; S

2 Y

61 i =1

(Yi Y ) 2

De clases (propiedad 1.3.2 o el ejemplo 3.1.2), se sabe que en el caso normal, Var[S 2X] = 24/(31-1) = 24 0,033 y Var[S2Y] = 24/(61-1) = 24 0,017.

2 Adems, VarS =

2 n 2VarS X + m 2VarS Y2 = 24 0,011 ( n + m) 2

As el estimador anterior tiene menor varianza y por lo tanto es mejor que los dos anteriores. b) Para el estimador S2p sea insesgado con respecto 2, los ponderadores deben sumar 1, += 1, es decir, = 1- y la varianza queda: Var [ S2p] = 2 24 0,033 + (1-)2 24 0,017 Derivando e igualando a cero, se tiene, 224 0,033 - 2(1-) 24 0,017 = 0 Resolviendo = 0,34 y = 1- = 0,66.

Una moraleja importante del ejercicio anterior es que la combinacin lineal de estimadores produce estimadores mejores que los originales, es decir, la unin hace la fuerza. Ejemplo 10 Un Alcalde de una de las comunas de Santiago, piensa repostular al cargo en las prximas elecciones municipales. El Alcalde quiere saber cul es la proporcin de los electores de la comuna que tienen la intencin de votar por l, si se presenta como candidato. En una muestra aleatoria simple de 1000 personas inscritas en los registros electorales de la comuna el 49% votara por el actual Alcalde. a) Explica cules son la poblacin, parmetro y estimador implcitos en el enunciado anterior. b) Explique las propiedades del estimador y porque son tiles para estimar el parmetro. El Alcalde cree que el cincuenta y uno por ciento de las intenciones de voto de toda la comuna le favorecen. Suponiendo que el alcalde tiene razn: Encuentra la distribucin asinttica de la proporcin de electores que apoya al Alcalde. Explica cmo se interpreta la distribucin anterior y que relacin tiene con el resultado de la encuesta del enunciado. d) Calcula la probabilidad de que la proporcin de electores que tienen la intencin de votar por el Alcalde en una muestra aleatoria simple de n=1000, sea inferior al 50%. e) Si 245 consultoras realizan otras 245 encuestas con n = 1000, en cuntas muestras, estimaramos que la intencin de voto por el Alcalde es inferior a al cincuenta por ciento? f) Un experto afirma que la diferencia entre el resultado de la encuesta y lo afirmado por el Alcalde puede tener dos causas: 1) La variacin aleatoria del estimador o bien, 2) El alcalde esta equivocado y su votacin es menor que el 51%. Explica usando un grfico cmo explican 1) y 2) la diferencia.
c) SOLUCION a) Poblacin Y = 1 si una persona de la comuna inscrita en los registros electorales extrada al azar, votara por al Alcalde, 0 si no.

Parmetro Alcalde.

= Proporcin de todos los inscritos en los registros de la comuna que votaras por el

Estimador P = Proporcin que votara por el Alcalde en una muestra aleatoria simple de n inscritos en los registros de la comuna. b) P es un estimador insesgado de y consistente, Var[P] = (1-)/n 0. Lo anterior significa, que si la muestra es grande probablemente la estimacin resultar cerca del verdadero valor del parmetro. c) Por el TLC dado n grande, P a N( = 0,51 , (1-)/n ) = N(0,51 ; (0,01581)2 ) La distribucin anterior, indica como se distribuyen los valores de P en infinitas hipotticas muestras de tamao n=1000 de la poblacin. As, la distribucin anterior determina probabilidades de que P se ubique en un determinado subintervalo de [ 0 , 1]. Distribucin de P

0,49 d)

0,51

Pr[ P < 0,50 ] = ( (0,50-0,51)/0,011581 ) = ( - 0,86 ) = 1 - ( 0,86 ) = 1- 0,80511 = 0,19. e) En aproximadamente en 245*0,19 = 48 casos. f) 1) La estimacin 49% es el resultado de un estimador que tiene una fluctuacin aleatoria, de modo que p < 0,50 puede ser fruto del azar. Los resultados de P estn centrados en = 0,51 pero estn dispersos a la izquierda y derecha. 2) Efectivamente, si el alcalde esta equivocado y su votacin es por ejemplo 0,48 < 0,51, entonces, la distribucin estar centrada a la izquierda de 0,51 y entonces ser ms probable valores inferiores al 50% que superiores.. Distribucin de P

0,48(real)

0,51(lo que cree el alcalde)

Ejemplo 11 Supngase que el nmero de barcos X diarios que llega a un puerto tiene una distribucin Poisson de parmetro .

En lugar de anotar el N de barcos que lleg en cada uno de 30 das, solamente se anot el nmero de das en que llegaron barcos. Si en 25 de los 30 das llegaron al menos un barco, entonces: Proponer un estimador de = Pr[ En un da llegue al menos un barco] y la estimacin correspondiente. b) Proponer un estimador de y la estimacin correspondiente.
a) SOLUCION a) Estimador de , P = Proporcin de das en que llega al menos un barco en una muestra aleatoria de n das. Estimacin: p = 25/30 = 0,83

b) = 1 Pr[ En un da no lleguen barcos ] = 1 Pr[ X = 0] = 1 - eAs, dado que = - Ln(1- ) Estimador de , ^ = -Ln(1-P)

Estimacin de , ^() = -Ln(1-0,83) = 1,77

El mtodo anterior, donde para estimar una funcin de un parmetro g() enchufamos dentro de la funcin un estimador conocido T de , es decir, g(T) es muy utilizada en estadstica ( en ingles de llama Plug in). Algunas propiedades que puede tener T como estimador del parmetro no son transmitidas a g(T) como estimador de g(). Ejemplo 12 Sea Y1 , Y2 ,..., Yn una m.a.s. de una variable Y con media y varianza 2. Analice el insesgamiento del siguiente estimador de la varianza: (n 1)Y12 + Yn21 + Yn2 = n +1
2

Solucin
Para que el estimador sea insesgado debe tenerse que:

E[ 2 ] = 2
Pero,

E[ 2 ] =

( n 1) E[Y12 ] + E[Yn21 ] + E[Yn2 ] n +1


2

(*)

E (Y 2 ) = E[( Y + ) = E[(Y ) 2 + 2(Y ) + 2 ] = E (Y ) 2 + 2


Porque: E (Y- )2 = 2 ; E[ 2 ] = 2 y E (2(Y-) ) ) = 2E(Y - ) = 2 (EY - E) ) = 0

10

Asi se obtiene: E[ Y2 ] = 2 + 2 Reemplazando en (*) se obtiene:

E[ 2 ] =

( n 1)( 2 + 2 ) + ( 2 + 2 ) + ( 2 + 2 ) = 2 n +1

As se tiene que el estimador propuesto es insesgado con respecto a la varianza de la poblacin.

Ejemplo 13
Sea,

Y1 , Y2 , ...., Yn

una m.a.s.(n) de Y con distribucin Bernoulli de parmetro desconocido 0<<1.

Considera los siguientes estimadores de :

1 = Y;
a) c) e)

2 =

1 (Y1 + Yn ) 2

2 es un estimador insesgado y calcula su varianza. Es consistente?. b) Encuentra el valor de que hace mxima la varianza de 1 para n fijo.
Demuestra que Proponga un estimador insesgado de 2 = Var[Y]. Escriba este estimador como funcin de d) Proponga estimadores insesgados para las varianzas de

1 y 2 .

1 .

Muestre que para n = 2 no existe un estimador insesgado de 3.

Solucin
a)

1 1 ( EY1 + EYn ) = ( + ) = 2 2 1 1 Var[ 2 ] = (VarY1 + VarYn ) = ( 2 + 2 ) = 2 / 2 4 4 2 no es consistente porque su varianza no tiende a 0 cuando, n crece. E 2 =
b)

Var 1 =

(1 ) n

Es fcil constatar que el mximo de la varianza se produce en = 0,5. c) 2 = Var[Y].= (1-) Como siempre el estimador insesgado de 2 es S2 , se tiene:

S
d)

i =1

(Yi Y ) 2 n 1

i =1

Yi n[Y ] 2 n 1

n i =1

Yi n[Y ] 2 n 1

nY n[Y ] 2 n = Y (1 Y ) n 1 n 1

Y (1 Y ) Var 1 = ; n 1
e)

nY (1 Y ) Var 2 = 2(n 1) E[T] = 3


11

Para n =2, si existiera un estimador insesgado T de 3, debera cumplir que:

Ahora,

E[T ] =

y1 , y 2

T ( y , y
1

) p ( y1 , y 2 )

Donde p, es la funcin de probabilidad conjunta de Y1, Y2, se tiene que: p(y1, y2) = p(y1)p(y2) = y1(1-)1-y1y2(1-)1-y2 = y1+ y2 (1-)2 - (y1 + y2) As reemplazando: E[T] = T(1,1)p(1,1)+ T(1,0)p(1,0)+ T(0,1)p(0,1)+ T(0,0)p(0,0) E[T] = T(1,1)2+ T(1,0)(1-)+ T(0,1)(1-)+ T(0,0)(1-)2 Se aprecia que E{T] es un polinomio en de grado 2, as es imposible obtener un polinomio de grado 3, como 3.

Ejemplo 14 Considera dos poblaciones Y1 e Y2 con la misma y varianza distintas 21 y 22 respectivamente. De cada poblacin, independientemente, se tienen muestra aleatorias de tamaos n1 e n2 respectivamente.
a)

Para estimar se propone el estimador: T= Y1 +Y 2 2 Muestra que T es insesgado y determina su varianza. Supn que los recursos permiten encuestar a 100 personas. Es decir, n1 + n2 =100. Qu tamaos de muestra se deben obtener de la poblacin 1 ( n1 ) y de la poblacin 2 (n2 ) para tener T de varianza mnima? Suponga 21 = 25 y 22 = 64 y determine el valor de la varianza mnima.

b)

Solucin
a)

ET =

EY 1 + EY 2 + = = 2 2
2 VarY 1 + VarY 2 12 2 = + 4 4n1 4n2

VarT =
b)

Dado que n1 + n2 =100 se tiene que n1 =100- n2. Reemplazando en la varianza, se tiene:

VarT =

2 12 2 + 4n1 4(100 n1 )

Derivando e igualando a cero para encontrar el n1 donde la varianza alcanza su mximo:


2 12 2 2 + = 0 implica n1= 100 1 /(1+2 ) y n2 = 100 2 /(1+2 ) (*) 4n1 4(100 n1 ) 2

12

n1 = 38 y n2 = 62.

Ntese que el resultado en (*) es razonable: para minimizar la varianza se debe muestrear proporcional a la desviacin estndar de cada poblacin. As, el tamao de la muestra es mayor en la poblacin que tiene mayor variabilidad. Ejemplo 16 Considera la poblacin Y = Remuneracin mensual de un trabajador extrado al azar de un universo de trabajadores de cierta industria. Suponga que la poblacin anterior tiene media y varianza 2. Se propone estimar seleccionando una sla persona al azar. El estimador sera la remuneracin del trabajador seleccionado. Es insesgado el estimador anterior? Cul es su error cuadrtico medio? b) Se propone un segundo estimador del parmetro , que sera el promedio de una muestra aleatoria simple de 10 trabajadores. El procedimiento anterior es mejor que el propuesto en la parte a). por qu? c) Un alumno del curso de Inferencia afirma que conoce un estimador con una media y varianza + / 2 n y 2/2n, respectivamente, donde n es el tamao de la
a)

muestra. Qu estimador recomendara Ud para estimar el parmetro , el promedio muestral o el estimador anterior? Explica tu respuesta.
SOLUCION a) El mtodo de estimacin propuesto equivale a seleccionar una m.a.s de tamao n = 1, Y 1. estimador es T = Y1. T es insesgado, ET = EY1 = . Su ECM es ECM(T) = Var[T] + Sesgo2 = Var{T] = Var[Y1 ] = 2 b) El estimador Entonces el

Y=

Y1 + Y2 + .... + Y10 es insesgado y 10

ECM [Y ] = VarY = ECM [Y ] =

2 10

As,

2 < = Var[T ] = ECM [T ] , de modo que el promedio muestral con n=10 es 10

mejor que con n=1. c) Sea T el estimador que propone al alumno, entonces, _ ECM[T ] = Var[T ] + [ ET - ]2 = 2/2n + 2/4n = 32/4n < 2/n = Var[Y]

13

A pesar que T es sesgado tiene un ECM menor que el promedio y tambin es consistente (ECM = 32/4n 0), entonces, es recomendable usar T.

14

You might also like