Professional Documents
Culture Documents
Prefacio
Con la intencion de apoyar la labor docente que desarrolla el Departamento de Estadstica
de la Facultad de Matematicas de la Pontificia Universidad Catolica de Chile, se ha realizado
un trabajo de recopilacion y elaboracion de ejercicios resueltos y propuestos para los curso
EYP2216 y EYP2214, algunos de los cuales fueron desarrollados en ayudantas y han sido
parte de interrogaciones en semestre anteriores.
Queremos agradecer muy en especial a FONDEDOC, por haber confiado en este proyecto
y habernos entregado todo su apoyo para poder ver realizada esta necesidad tanto para el
Departamento de Estadstica, como para todos los alumnos y alumnas que son beneficiados
de los cursos de servicio que ofrece el mismo.
Este trabajo ha sido fruto de la labor que desarrollaron docentes y ayudantes que dictaron
el curso entre los a
nos 2001 y 2004.
Especficamente deseamos agradecer a los profesores
Claudio Beltran
Rolando de la Cruz
Hector Gomez
Patricia Jimenez
Ricardo Olea
Alexis Rojas
Ademas quisieramos agradecer el aporte de Jorge Gonzalez y Mario Tagle, tanto por el
material donado, como por la revision de este libro.
Atentamente.
Direccion
Departamento de Estadstica
Facultad de Matematicas
Santiago, Diciembre 2004
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
II
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
Indice general
1. An
alisis Descriptivo
1.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1
18
2. Probabilidad
2.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
27
42
45
45
54
59
59
70
5. Sensibilidad y Especificidad
5.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
73
73
77
6. Estimaci
on
79
6.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
6.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
7. Intervalos de Confianza y Test de Hip
otesis
105
7.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
7.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
8. Test de Homogeneidad, Independencia y Bondad de Ajuste
131
8.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
8.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
9. An
alisis de Regresi
on
151
9.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
9.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
INDICE GENERAL
IV
A. Formulario de Distribuciones
B. Formulario de An
alisis de Regresi
on Simple
C. Tablas de distribuci
on
C.1. Distribucion t de Student .
C.2. Distribucion 2 . . . . . .
C.3. Distribucion F ( = 0,05)
C.4. Distribucion Normal . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
III
.
.
.
.
.
.
.
.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
VII
VII
VIII
IX
XI
Captulo 1
An
alisis Descriptivo
1.1.
Ejercicios Resueltos
EJERCICIO 1
Unos transductores de temperatura de cierto tipo se embarcan en lotes de 50. Se selecciono una muestra de 60 lotes y se determino la cantidad de transductores en cada lote que
no se apegaban a las especificaciones de dise
no y resultaron los siguientes datos:
2
0
5
1 2
4 2
0 2
4 0
1 3
3 2
1
1
1
3 2
1 3
0 6
0 5
4 1
4 2
3
2
1
3 1
3 2
6 0
3 2
2 8
3 3
4
4
3
7 0
5 1
6 1
2 3
3 1
2 3
SOLUCION
Captulo 1. An
alisis Descriptivo
(b) Tabla de distribucion de frecuencias: Considerando que son datos discretos, la forma
correcta de hacer esta tabla es dejando una clase por n
umero de transductores que no
se apegaban a las especificaciones. Resultando la siguiente:
Clase
0
1
2
3
4
5
6
7
8
Frec.
7
12
13
14
6
3
3
1
1
Frec. Relativa
0.12
0.20
0.21
0.23
0.10
0.05
0.05
0.02
0.02
Frec. Acumulada
7
19
32
46
52
55
58
59
60
(c) Aqu debemos considerar todos aquellos lotes que tenan 0, 1, 2, 3, 4, o 5 transductores
defectuosos
55
= 0,917
60
(d) Analogamente a la parte (c), aqu debemos considerar todos aquellos lotes que tenan
5, 6, 7 o 8 transductores defectuosos
52
8
=1
= 1 0,867 = 0,133
60
60
(e) El Histograma tiene una asimetra positiva apreciable. Se dispersa bastante respecto a
su centro.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
X=
1X
xi fi
n i=1
Donde m es el n
umero de clases, xi el valor de la clase i, y fi frecuencia de la clase i.
8
X=
1X
152
2,5
xi fi =
8 i=1
60
Aunque esta no es una medida de posicion adecuada para este caso, en promedio hay
2.5 traductores que no se apegaban a las especificaciones del dise
no.
(g) El calculo de la mediana para este caso es obvio por la composicion de las clases, ya
que cada clase esta compuesta de un solo valor, es decir, lo mas simple sera ver en
que frecuencia acumulada se encuentra el valor n2 = 60
= 30 y a que clase corresponde,
2
para este caso el valor 30 se encuentra en la frecuencia acumulada de la clase 2, por lo
que la M e = 2.
De una manera mas formal sera por el procedimiento para el caso de datos tabulados
y discretos, siendo este como sigue:
i. Observemos en la tabla de la parte (a) la columna de las Frecuencias acumuladas
(menor que).
ii. Se determina la menor frecuencia acumulada Nj que supera a n2 .
Es decir
n
< Nj
2
En esta situacion puede ocurrir que
n
2
Nj1
1. Cuando
n
2
n
< Nj
2
Captulo 1. An
alisis Descriptivo
EJERCICIO 2
Un Constructor Civil visita 25 villas en una ciudad y en cada una anoto el n
umero de casas
que han sufrido da
nos ocasionados por un terremoto, de lo cual resultaron los datos:
15
16
18
19
19
20
17
18
16
18
25
18
19
17
19
15
20
16
17
18
18
18
17
17
15
SOLUCION
(a) Discretos.
(b) Como son datos discretos, la tabla de frecuencias presentara una clase por cada valor
en los datos, resultando la siguiente tabla
Clase
15
16
17
18
19
20
25
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
X=
xi fi
i=1
5
X
445
15 3 + 16 3 + 17 5 + 18 7 + 19 4 + 20 2 + 25 1
=
= 17,8
25
25
fi
i=1
(h) Del Ejercicio 1, tenemos que n2 = 12,5, entonces la clase que contiene a Nj (La frecuencia acumulada que supera a n2 ) es la 4, es decir N4 = 7.
como
n
2
(i) Del Histograma de la figura siguiente se aprecia que lo que se dio con mayor frecuencia
en las villas, fueron 18 casas con da
nos, seguidas por 17 y 19, manteniendose las otras
clases relativamente semejantes.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
Captulo 1. An
alisis Descriptivo
Frecuencia
3
7
14
28
64
57
23
13
7
4
(a) Construya un histograma para estos datos, cuyo eje vertical corresponda a las frecuencias relativas.
(b) Obtenga la duracion media.
(c) Obtenga la desviacion estandar.
(d) Encuentre e interprete un intervalo que contenga el 60 % central de los datos.
(e) Mas o menos, Cual es la mediana de la duracion de las ampolletas?
SOLUCION
7
Frecuencia Frecuencia Relativa
3
0.014
7
0.032
14
0.064
28
0.127
64
0.291
57
0.259
23
0.105
13
0.059
7
0.032
4
0.018
Frecuencia Acumulada
3
10
24
52
116
173
196
209
216
220
X=
yi fi
i=1
10
X
219100
= 995,91
220
fi
i=1
Captulo 1. An
alisis Descriptivo
(c) La varianza para datos tabulados se calcula de la siguiente manera:
n
X
S2 =
fi (yi X)2
i=1
n1
en este caso
S 2 = 28613,325
La desviacion estandar es:
S=
S2 =
28613,325 = 169,15
np
220 20
=
= 44
100
100
np
220 80
=
= 176
100
100
44 24
P20 = 800 + 99
= 870,71
52 24
176 173
P80 = 1100 + 99
= 1112,91
196 173
Por lo tanto el intervalo que contiene al 60 % de los datos es:
(870,71; 1112,91)
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
n
2
Nj1
i. Si ocurre que
n
2
n
< Nj
2
n
2
110 52
M e = 900 + 99
= 989,718
116 52
EJERCICIO 4
Los tiempos de CPU que se indican en la tabla de frecuencias representan el tiempo (en
segundos) que 25 trabajos estuvieron en control de la unidad de proceso (CPU) de una
computadora mainframe grande.
Intervalo de Clase Frecuencia de Clase
[0.015-0.715)
5
[0.715-1.415)
9
4
[1.415-2.115)
[2.115-2.815)
3
[2.815-3.515)
1
[3.515-4.215)
2
[4.215-4.915]
1
(a) Calcule el tiempo promedio de CPU.
(b) Calcule e interprete la desviacion estandar.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
10
Captulo 1. An
alisis Descriptivo
(c) Construya e interprete un histograma de frecuencia.
(d) Encuentre e interprete el intervalo intercuartil.
SOLUCION
A continuacion la tabla de frecuencias completa
Intervalo de Clase
[0.015-0.715)
[0.715-1.415)
[1.415-2.115)
[2.115-2.815)
[2.815-3.515)
[3.515-4.215)
[4.215-4.915]
f
5
9
4
3
1
2
1
F
5
14
18
21
22
24
25
fr
0,2
0,36
0,16
0,12
0,04
0,08
0,04
Fr
0,2
0,56
0,72
0,84
0,88
0,96
1
yi
0,35
1,065
1,765
2,465
3,165
3,865
4,565
donde
N = 25
yi : punto medio de la clases i-esima
fi : frecuencia absoluta de la clases i-esima
(a) El tiempo promedio de CPU es:
x=
7
1 X
fi yi
N i=1
1
(0,365 5 + 1,065 9 + 1,765 4 + 2,465 3 + 3,165 1 + 3,865 2 + 4,565 1)
25
41,325
25
= 1,653
(b) La desviacion estandar es la siguiente:
S2 =
1 X
fi (yi x)2
N 1 i=1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
S2 =
11
1
5 (1,288)2 + 9 (0,588)2 + 4 (0,122)2
24
+3 (0,812)2 + 1 (1,512)2 + 2 (2,212)2 + 1 (2,912)2
33,9864
24
= 1,4161
S=
1,4161
= 1,19
La desviacion estandar es una medida de dispersion de los datos con respecto a la media.
En este caso S = 1,19 seg., es alta, lo cual indica la presencia de datos extremos.
(c) El histograma de frecuencia se muestra en la figura siguiente.
12
Captulo 1. An
alisis Descriptivo
este rango indica que en el se ubica el 50 % central de los datos, donde Q1 = P25 y
Q3 = P75 .
De la tabla de frecuencias tenemos que Q1 Clase 2 y Q3 Clase 4.
Luego los percentiles son
P25 = 0,715 + 0,7
6,255
145
18,7518
2118
= 0,812
= 2,290
SOLUCION
13
6
1 X
x=
fi yi
N i=1
1
(2800 3 + 1400 9 + 600 15 + 150 21 + 50 27)
5000
34500
5000
= 6,9
Los matrimonios duran en promedio 6.9 a
nos.
(b) La desviacion estandar de la duracion de los casamientos es:
S2 =
138150
= 27,64 S = 5,3 a
nos
4999
14
Captulo 1. An
alisis Descriptivo
luego
Q1 = P25 = 0 + 6
1250 0
= 2,7
2800
3n
3 5000
=
= 1250 < N2 la clase del percentil 75 es 6 12
4
4
luego
Q3 = P75 = 6 + 6
3750 2800
= 10,1
1400
As tenemos
I = (2,7; 10,1)
El 50 % central de los matrimonios dura entre los 2.7 a
nos y 10.1 a
nos.
EJERCICIO 6
La siguiente informacion corresponde al ingreso neto (X) como porcentaje de sus activos,
para las 20 compa
nas exitosas:
17 23 22 18 8 7 12 2 49 14
14 36 16 7 3 8 10 11 20 21
De los ingresos netos como porcentajes de las ventas (Y), informados por 250 Compa
nas
regularmente exitosas se sabe que:
250
X
i=1
yi = 2125
250
X
yi2 = 18625
i=1
(a) Compare el coeficiente de variacion del ingreso neto como porcentaje de la activos, con
la del ingreso neto como porcentaje de las ventas, para las Compa
nas exitosas y las
regularmente exitosas, respectivamente. Cual ingreso neto es mas homogeneo?
(b) Si en las Compa
nas regularmente exitosas, se eliminan dos valores extremos 0.8 y 14.5,
cual es la desviacion estandar del ingreso neto como porcentaje de las ventas, para
las 248 Compa
nas restantes? (Utilice 3 decimales)
SOLUCION
(a) el Coeficiente de variacion (C.V) se calcula como:
C.V =
S
X
2
Se puede calcular considerando Sn1
(varianza muestral) o Sn2 (varianza poblacional).
En la siguiente tabla se entrega el resumen de ambos casos
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
15
X
Y
2
X
Sn1
C.V
Sn2
C.V
15.9 124.199 0.700 130.735 0.719
8.5
2.259 0.176
2.250 0.176
Como C.V (Y ) < C.V (X), se puede concluir que el ingreso neto como porcentaje de
las ventas es mas homogeneo que el ingreso neto como porcentaje de la activos.
(b) Si consideramos varianza poblacional tenemos que dado lo siguiente:
248
X
= 2109,7
Y = 8,506
i=1
248
X
i=1
la desviacion estandar es
q
Sn =
Y2Y =
EJERCICIO 7
Actualmente existe un reglamento con respecto de la obligacion de las construcciones por
cumplir normas mnimas de seguridad, entre ellas se encuentra la resistencia al fuego de los
elementos de una construccion. Un sistema de proteccion consiste en utilizar una pintura
que permite aislar el elemento, llamada pintura ntumescente.
Antes de la construccion de un edificio se realizaron ensayos en pilares de acero que fueron
expuestos al fuego por sus 4 caras, los cuales fueron pintados con diferentes espesores de esta
pintura, en micrones y se midio su resistencia al fuego, en minutos, hasta que se comenzaba
a deteriorar. La informacion se presenta a continuacion.
ESPESOR DE LA
PINTURA (micrones)
[0 335)
[335 670)
[670 1005)
[1005 1340)
[1340 1675]
(a) Seg
un el tiempo de exposicion al fuego antes de ser da
nado el pilar, la resistencia al
fuego se clasifica como clases F30, si este tuvo una duracion entre 30 y 59 minutos.
Que porcentaje de los pilares no se clasificaran como clase F30?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
16
Captulo 1. An
alisis Descriptivo
(b) Cual distribucion es mas homogenea en relacion al espesor de la pintura ntumescente, la de los pilares que mostraron una resistencia al fuego de menos de 52 minutos
o la de los pilares con resistencia igual o superior a 52 minutos?
(c) Si consideramos solo los pilares que fueron pintados con un espesor entre 670 y 1005
micrones. Grafique la distribucion de estos pilares seg
un sea su resistencia al fuego.
SOLUCION
(a) Considerando solo la resistencia al fuego tenemos las siguiente tabla de frecuencias y
con la cual podremos obtener el porcentaje de de pilares que no se clasifican como F30.
Resistencia
< 22
[22 52)
[52 82)
82
f
16
18
23
26
F
16
34
57
83
Fr
0.19
0.41
0.69
1.00
P = 59 = 52 + 30
83
100
16
= 25,06
18
83
100
34
= 47,43
23
luego = 22,37 %, es decir, el 22.37 % de los pilares se clasifica como F30, por
ende el 73.63 % no corresponde a esa categora.
(b) La idea es calcular los coeficientes de variacion, para los dos grupos de resistencia, para
ello reconstruimos la tabla de frecuencias como sigue:
Espesor
[000 335)
[335 670)
[670 1005)
[1005 1340)
[1340 1675)
R < 52 R 52
mi
16
1
167.5
13
2
502.5
4
4
837.5
1
17
1172.5
0
25
1507.5
263,6446
0,6526
403,970
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
17
310,1497
0,2446
1268,2142
la distribucion es mas homogenea en relacion al espesor de la pintura en la correspondiente a los pilares con resistencia igual o superior a 52 minutos.
(c) Considerando solo el grupo de Espesor entre 670 y 1005 la tabla de frecuencias obtenida
es la siguiente:
Resistencia
< 22
[22 52)
[52 82)
82
frecuencia
1
3
3
1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
18
Captulo 1. An
alisis Descriptivo
1.2.
Ejercicios Propuestos
1. La resistencia del concreto depende del procedimiento que se utilice para curarlo. Dos
metodos distintos de curado mostraron los siguientes resultados en ensayos independientes.
Se considera que el concreto queda con resistencia optima, cuando es superior a 3220
libras/pulgadas2 .
Resistencia Metodo 1 Metodo 2
[2500-2740)
3
2
[2740-2980)
4
3
[2980-3220)
5
7
[3220-3460)
5
5
6
4
[3460-3820]
a) Que porcentaje de los ensayos con el metodo 1 de curado, resultan con concreto
de resistencia optima?
b) Que porcentaje de los ensayos con el metodo 2 de curado, resultan con concreto
de resistencia optima?
c) Construya un grafico adecuado que muestre la distribucion de los ensayos con el
metodo 1 seg
un resistencia de concreto y ubique en dicho grafico el valor numerico
de su resistencia media.
d ) Construya un grafico adecuado que muestre la distribucion de los ensayos con el
metodo 2 seg
un resistencia de concreto y ubique en dicho grafico el valor numerico
de su resistencia media.
2. Denote por X n y Sn2 la media y la varianza para la muestra X1 , . . . , Xn , y denote por
2
X n+1 y Sn+1
estas cantidades cuando una observacion adicional Xn+1 se a
nade a la
muestra.
a) Demuestre como X n+1 se puede calcular de X n y Xn+1 .
b) Muestre que
2
= (n 1)Sn2 +
nSn+1
n
(Xn+1 X n )2
n+1
2
de modo que Sn+1
se puede calcular de Xn+1 , X n y Sn2 .
19
3. Las longitudes de las rutas de transporte en determinada lnea suelen variar entre s. En
el artculo Planning of City Bus Routes(J. of the Institution of Engineers, 1995, pp.
211-215) aparece la siguiente informacion sobre las longitudes (en km) de determinada
lnea:
Longitud Frecuencia
[6 8)
6
[8 10)
23
[10 12)
30
[12 14)
35
[14 16)
32
[16 18)
48
[18 20)
42
[20 22)
40
[22 24)
28
[24 26)
27
[26 28)
26
[28 30)
14
[30 35)
27
[35 40)
11
[40 45]
2
a) Trace el histograma para estas frecuencias.
b) Que proporcion de las rutas tienen una longitud menor que 20? Que proporcion
de estas rutas tienen longitudes de cuando menos 30?
c) Mas o menos, cual es el valor del 90 percentil de la distribucion de longitudes
de ruta?
d ) Mas o menos, cual es la mediana de la longitud de las rutas?
4. El artculo C
an We really Walk Straight(Amer. J. of Physical Anthropology, 1992 pp.
19-27) reporto un experimento en el que se pidio, a cada uno de 20 hombres sanos, que
caminaran en lnea recta tan derecho como fuera posible hacia un blanco situado a 60
m a velocidad normal. Considere las siguientes observaciones sobre cadencia (n
umeros
de pasos por segundo):
0.95 0.85 0.92 0.95 0.93 0.86 1.00 0.92 0.85 0.81
0.78 0.93 0.93 1.05 0.93 1.06 1.06 0.96 0.81 0.96
Utilice los metodos desarrollados en el captulo 1 para resumir la informacion; incluya
una interpretacion o discusion, siempre que sea apropiado. (Nota: el autor del artculo
utilizo una analisis estadstico de gran complejidad para analizar estos datos).
5. Para cada una de las siguientes afirmaciones indique si ella es verdadera ( V ) o falsa
( F ). Justifique
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
20
Captulo 1. An
alisis Descriptivo
a) M e = (Q1 + Q3 )/2 , siendo Me = Mediana, Qi = i - esimo cuartil ( i = 1, 3 )
b) Si el valor maximo entre ( X1 , X2 , . . . , Xk ) = 18 , entonces , Moda = 18.
c) Si una variable es de nivel de medicion nominal , entonces la medida de tendencia
central mas adecuada es la mediana.
6. Responda brevemente :
a) De dos definiciones de tipos de muestreo
b) Diga cuando una variable es del tipo discreta y cuando es del tipo continua
c) Diga que se entiende por : No depende de la unidad de medida se
nale por
lo menos dos medidas que cumplan y dos medidas que no cumplan con lo antes
se
nalado.
2
0.030
0.030
0.056
0.061
0.042
0.052
0.040
0.061
0.061
0.051
0.044
0.045
0.042
0.058
0.046
0.039
0.055
0.053
0.020
0.039
0.037
0.060
0.066
0.039
0.062
0.047
0.052
0.057
0.062
0.051
21
Peso (gramos) Frecuencia
[960 980)
60
160
[980 1000)
[1000 1020)
280
260
[1020 1040)
[1040 1060)
160
80
[1060 1080]
Total
1000
El
El
El
El
20 %
30 %
30 %
20 %
de
de
de
de
los
los
los
los
pollos
pollos
pollos
pollos
[50 90)
0,12
0,08
0,00
Y (en miles de $)
[90 130) [130 170)
0,08
0,04
0,12
0,10
0,12
0,18
[170 250]
0,00
0,05
0,11
22
Captulo 1. An
alisis Descriptivo
(d) Si para las fiestas patrias la empresa otorgo un aguinaldo de $25.000 a los empleados cuyo sueldo era inferior a los $120.000, mientras que para aquellos cuyo sueldo
era superior a esa cifra el aguinaldo fue de $15.500, cuantos de los empleados
que tienen mas de 8 a
nos de antig
uedad en la empresa recibieron un aguinaldo de
$15.500?
11. Una empresa que se dedica a la fabricacion de mallas de acero para hormigon armado,
ha tomado una muestra de las mallas que compro una constructora en un mes determinado, registrando por cada unidad el peso de la malla (en Kg) X, el tipo de malla Y
(con borde C y sin bordo S) y el diametro de las barras (en mm) Z. Los resultados
obtenidos fueron los siguientes:
Z
Y
Menos de 5 C
S
[5 7]
C
S
Mas de 7
C
S
(15-28] (28-41]
10
6
8
4
2
8
2
6
0
4
0
2
X
(41-54]
4
2
3
5
4
5
(54-67] Mas de 67
2
0
0
0
11
4
11
0
20
7
15
5
Planta A
50
30
60
20
40
Planta B
40
30
0
10
20
Planta C
20
40
70
15
5
23
Especialidad
Alba
nil
A
N
Carpintero A
N
Electricista A
N
Pintor
A
N
de 300
0
0
9
3
1
0
0
0
Superficie Sembrada
Mezcla
[200 1180) [1180 3140) [3140 5100) [5100 6080]
Manquehue
7
4
6
2
Estadios
3
6
8
4
Ray-grass
0
7
9
5
Lon grass trevol
2
5
4
1
Total
12
22
27
12
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
Mas de 6080
0
3
4
0
7
24
Captulo 1. An
alisis Descriptivo
(a) Clasifique las variables involucradas seg
un nivel de medicion y tama
no de recorrido.
(b) Calcule las medidas marginales de posicion mas adecuadas para cada variable e
indique las correspondientes medidas de dispersion.
(c) Construya un grafico que muestre la distribucion de las plazas sembradas seg
un
mezcla de semilla utilizada.
(d) Compare la dispersion de las superficies sembradas con mezcla de manquehue con
la dispersion de las superficies sembradas con mezcla Long grass trebol.
(e) Si un kilo de mezcla manquehue sirve para plantar una superficie de 13 metros
cuadrados. Que porcentaje de las superficies plantadas en que se utilizo esta
mezcla, ocupara mas de 284 kilos?
15. El n
umero de llamadas telefonicas de larga distancia nacional registrada por una empresa distribuidora durante una hora de un da determinado, se realizara en horarios
normales y se consideraron llamadas de a lo mas 3 minutos de duracion.
Carrier
188
171
123
Total
25
30
20
22
21
20
22
20
20
200
Cantidad
de tiras
2300-3000
0,08
0-10
0,02
0,00
0,10
10-20
0,02
0,00
0,07
20 y mas
0,01
0,00
Total
0,30
25
Precios (pesos)
3000-4500 4500-6000 6000 y mas Total
0,04
0,01
0,00
0,13
0,07
0,02
0,00
0,11
0,00
0,09
0,04
0,13
0,02
0,00
0,00
0,12
0,08
0,01
0,00
0,11
0,02
0,06
0,12
0,20
0,01
0,00
0,00
0,08
0,03
0,01
0,00
0,05
0,00
0,03
0,04
0,07
0,27
0,23
0,20
1,00
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
26
Captulo 1. An
alisis Descriptivo
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
Captulo 2
Probabilidad
2.1.
Ejercicios Resueltos
EJERCICIO 1
Las tres opciones preferidas en cierto tipo de departamento nuevo, son con resistencia antissmica (A), calefaccion central (B) y con excelentes terminaciones (C). Si 70 % de los
compradores piden A, 80 % B, 75 % C, 85 % A o B, 90 % A o C, 95 % B o C y 98 % A, B o
C, calcule las probabilidades de los siguientes eventos:
(a) El siguiente comprador selecciona, por lo menos, una de las tres opciones.
(b) El siguiente comprador esta interesado en otras opciones.
(c) El siguiente comprador solo selecciona que tenga resistencia antissmica y ninguna de
las otras dos opciones.
(d) El siguiente comprador selecciona exactamente una de las tres opciones.
SOLUCION
Reescribamos la informacion que nos entregan:
P (A) = 0,7
P (B) = 0,8
P (C) = 0,75
P (A B) = 0,85
P (A C) = 0,9
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
28
Captulo 2. Probabilidad
P (B C) = 0,95
P (A B C) = 0,98
Luego:
(a) P (A B C) = 0,98
(b) 1 P (A B C) = 0,02
(c) P (A B C) P (B C) = 0,98 0,95 = 0,03
(d) P (A B C) P (B C) + P (A B C) P (A C) + P (A B C) P (A B)
= 3P (A B C) P (B C) P (A C) P (A B)
= 3 0,98 0,95 0,9 0,85
= 0,24
EJERCICIO 2
Se toman muestras de una pieza fundida de aluminio y se clasifican de acuerdo con el acabado
de la superficie (en micropulgadas) y con las mediciones de longitud. A continuacion se
resumen los resultados obtenidos con 100 muestras.
Acabado de la
Superficie
Excelente
Bueno
Longitud
Excelente Bueno
75
7
10
8
SOLUCION:
Sean los eventos A: Acabado Excelente y B: Longitud Excelente, y respectivamente Ac :
Acabado bueno y B c : Longitud Buena, entonces:
Ac B = 10;
B c = 15;
A B = 75 + 7 + 10
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
29
75+7
100
(b) P (B) = P (B A) + P (B Ac ) =
75+10
100
82
100
10+8
100
85
100
18
100
75
100
92
100
93
100
EJERCICIO 3
A continuacion se ofrece un resumen de varias ordenes de compra de dispositivos de alumbrado, de acuerdo con las caractersticas opcionales solicitadas para estos.
Proporci
on de
o
rdenes de compra
Sin caractersticas opcionales
0.3
Una caracterstica opcional
0.5
Mas de una caracterstica opcional
0.2
(a) Cual es la probabilidad de que en una orden se solicite al menos una caracterstica
opcional?
(b) Cual es la probabilidad de que en una orden no se pida mas de una caracterstica
opcional?
SOLUCION:
Sean los eventos:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
30
Captulo 2. Probabilidad
S: Sin caractersticas opcionales.
U: Una caractersticas opcional.
M: Mas de una caractersticas opcional.
Entonces
(a) P (al menos una caracterstica) = P (U ) + P (M ) = 0,5 + 0,2 = 0,7
(b) P (no mas de una caracterstica) = P (S) + P (U ) = 0,3 + 0,5 = 0,8
EJERCICIO 4
La tabla siguiente presenta un resumen del analisis realizado a las flechas de un compresor
para determinar el grado con que estas satisfacen ciertos requerimientos.
la curva cumple
con los requerimientos
s
no
s 345
5
no 12
8
(a) Si se toma una flecha al azar, cual es la probabilidad de que cumpla con los requerimientos de acabado superficial?
(b) Cual es la probabilidad de que la flecha seleccionada cumpla con los requisitos de
acabado o con los de curvatura?
(c) Cual es la probabilidad de que la flecha seleccionada cumpla con los requisitos de
acabado o que no cumpla con los de curvatura?
(d) Cual es la probabilidad de que la flecha seleccionada cumpla con los requisitos de
acabado y curvatura?
SOLUCION:
Sean los eventos A: Cumple con acabado superficial, Ac : No cumple con acabado superficial,
C: Cumple con curvatura, C c : No cumple con curvatura.
(a) P (A) = P (A C) + P (A C c ) =
345+5
370
350
370
350+357345
370
362
370
350+135
370
358
370
350+357362
370
345
370
(c) P (A C c ) = P (A) + P (C c ) P (A C c ) =
(d) P (A C) = P (A) + P (C) P (A C) =
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
31
EJERCICIO 5
Continuacion del ejercicio anterior. Las flechas se clasifican, ademas, en terminos de la
maquina herramienta utilizada en su fabricacion.
Maquina Herramienta 1
la curva cumple
con los requerimientos
s
no
s 200
1
no 4
2
Maquina Herramienta 2
la curva cumple
con los requerimientos
s
no
s 145
4
no 8
6
(a) Si se elige una flecha al azar, cual es la probabilidad de que cumpla con los requerimientos de acabado o con los de curvatura, o que provenga de la maquina herramienta
1?
(b) Si se escoge una flecha al azar, cual es la probabilidad de que cumpla con los requerimientos de acabado o que cumpla con los de curvatura o que provenga de la maquina
herramienta 2?
(c) Si se elige una flecha al azar, cual es la probabilidad de que cumpla con los requisitos
de acabado y curvatura o que provenga de la maquina herramienta 2?
(d) Si se toma una flecha al azar, cual es la probabilidad de que cumpla con los requisitos
de acabado o que provenga de la maquina herramienta 2?
SOLUCION:
Agregaremos a los eventos definidos en el ejercicio anterior, M1: maquina 1 y M2: maquina
2.
(a) P (A C M 1)
= P (A) + P (C) + P (M 1) P (A C) P (A M 1) P (C M 1) + P (A C M 1)
=
350+357+207345201204+200
370
364
370
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
32
Captulo 2. Probabilidad
(b) P (A C M 2)
= P (A) + P (C) + P (M 2) P (A C) P (A M 2) P (C M 2) + P (A C M 2)
=
350+357+163345149153+145
370
368
370
(c) P ((A C) M 2) = P (A C) + P (M 2) P (A C M 2) =
(d) P (A M 2) = P (A) + P (M 2) P (A M 2) =
350+163149
370
345+163145
370
363
370
364
370
EJERCICIO 6
En cierta gasolinera, 40 % de los clientes utilizan gasolina regular sin plomo (A1 ), 35 %
gasolina extra sin plomo (A2 ) y 25 % gasolina premium sin plomo (A3 ). De los clientes que
consumen gasolina regular, solo 30 % llenan sus tanques (evento B). De los que consumen
gasolina extra, 60 % llenan sus tanques, mientras que, de los que usan premium, 50 % llenan
sus tanques.
(a) Cual es la probabilidad de que el siguiente cliente pida gasolina extra sin plomo y
llene su tanque?.
(b) Cual es la probabilidad de que el siguiente cliente llene el tanque?.
(c) Si el siguiente cliente llena el tanque, Cual es la probabilidad de que pida gasolina
regular?, extra? y premium?.
SOLUCION
Sean los siguientes eventos:
A1 : Gasolina regular sin plomo
A2 : Gasolina extra sin plomo
A3 : Gasolina Premium sin plomo
B: Llena el tanque
Reescribiendo la informacion entregada obtenemos:
P (A1 ) = 0,4
P (A2 ) = 0,35
P (A3 ) = 0,25
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
33
P (B|A1 ) = 0,3
P (B|A2 ) = 0,6
P (B|A3 ) = 0,5
P (A1 B)
P (B)
P (B|A1 )P (A1 )
P (B)
0,30,4
0,455
P (A2 |B) =
P (A2 B)
P (B)
P (B|A2 )P (A2 )
P (B)
0,60,35
0,455
= 0,4615
P (A3 |B) =
P (A3 B)
P (B)
P (B|A3 )P (A3 )
P (B)
0,50,25
0,455
= 0,2747
= 0,2637
EJERCICIO 7
En relacion al ejercicio anterior, considere la siguiente informacion adicional sobre el uso de
las tarjetas de credito:
70 % de los clientes que consumen gasolina regular y llenan su tanque usan una tarjeta
de credito.
50 % de todos los clientes que consumen gasolina regular y no llenan su tanque usan
tarjeta de credito.
60 % de todos los clientes que consumen gasolina extra y llenan su tanque usan tarjeta
de credito.
50 % de todos los clientes que consumen gasolina extra y no llenan su tanque usan
tarjeta de credito.
50 % de todos los clientes que consumen gasolina premium y llenan su tanque usan
tarjeta de credito.
40 % de todos los clientes que consumen gasolina premium y no llenan su tanque usan
tarjeta de credito.
Calcule la probabilidad de cada uno de los siguientes eventos para el siguiente cliente que
llegue:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
34
Captulo 2. Probabilidad
(a) {extra,llena el tanque y usa tarjeta de credito}.
(b) {premium, no llena el tanque y usa tarjeta de credito}.
(c) {premium y usa tarjeta de credito}
(d) {usa tarjeta de credito}, (un diagrama de arbol puede ser u
til).
SOLUCION:
A los eventos definidos en el ejercicio anterior, agregaremos C: Usa tarjeta de credito.
Reescribiendo nuevamente la informacion entregada en esta parte, obtenemos:
P (C|A1 B) = 0,7
P (C|A1 B c ) = 0,5
P (C|A2 B) = 0,6
P (C|A2 B c ) = 0,5
P (C|A3 B) = 0,5
P (C|A3 B c ) = 0,4
(a)
P (A2 B C) =P (C|A2 B) P (A2 B)
=P (C|A2 B)P (B|A2 )P (A2 )
=0,6 0,6 0,35 = 0,126
(b)
P (A3 B c C) =P (C|A3 B c )P (A3 B c )
=P (C|A3 B c )P (B c |A3 )P (A3 )
=0,4 0,5 0,25 = 0,05
(c)
P (A3 C) =P (A3 C B) + P (A3 C B c )
=P (C|A3 B)P (A3 B) + P (C|A3 B c )P (A3 B c )
=P (C|A3 B)P (B|A3 )P (A3 ) + P (C|A3 B c )P (B c |A3 )P (A3 )
=0,5 0,5 0,25 + 0,4 0,5 0,25 = 0,1125
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
35
36
Captulo 2. Probabilidad
(a) Cual es la probabilidad de encontrar una botella con un volumen incorrecto en su
interior?
(b) Cual es la probabilidad de encontrar un botella llena con un volumen incorrecto y que
haya sido llenado cuando el proceso se realiza a baja velocidad?
(c) Cual es la probabilidad de que el proceso de llenado de las botellas haya sido a baja
velocidad, si se sabe que la botella esta efectivamente con un volumen correcto?
(d) Si se encuentra una botella llenada con un volumen incorrecto, cual es la probabilidad
de que haya sido llenado cuando el proceso se realiza a alta velocidad?
SOLUCION:
Se definen los siguientes eventos:
A: Llenado a alta velocidad.
B: Llenado a baja velocidad.
C: Volumen llenado correcto
I: Volumen llenado incorrecto
P (BC)
P (C)
P (AI)
P (I)
0,750,999
0,750,999+0,250,99
0,250,01
0,250,01+0,750,001
= 0,7516
= 0,7692
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
37
EJERCICIO 9
ES ESTO!. Un jugador A, comienza
Un juego para dos jugadores se denomina QUE
lanzando un dado numerado en cinco de sus caras: 1, 2, 3, 4 y 6; y en la sexta cara tiene escrita
ES ESTO!. Las caras numeradas son las puntuaciones que va obteniendo
la frase QUE
ES ESTO!. Entonces, el turno
cada vez. El jugador A sigue jugando hasta que saque QUE
pasa al jugador B que lanza un segundo dado. Este dado indica en cuatro de sus caras que
el turno de lanzar el dado numerado pasa al jugador B y otras dos caras que indican que el
jugador A contin
ua con el dado numerado.
(a) Cual es la probabilidad de que el jugador A saque un total de 4 ptos. en dos tiradas,
ES ESTO!?
sin que haya salido QUE
(b) Cual es la probabilidad de que, despues de lanzar el dado el jugador A, lance el jugador
B y el jugador A pierda su turno?
(c) Cual es la probabilidad de que el jugador A le toque lanzar en la tercera tirada?
SOLUCION:
Sea definen los siguientes eventos:
Ak : resultado en el k-esimo lanzamiento del dado numerado por el jugador A.
Ak : Turno k-esimo de jugar el dado numerado corresponde al jugador A; con k = 2, 3, . . ..
B k : Turno k-esimo de jugar el dado numerado corresponde al jugador B; con k = 2, 3, . . ..
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
1 1 1 1 1 1
+ +
6 6 6 6 6 6
3
36
1
12
38
Captulo 2. Probabilidad
(b)
P (B 2 B 3 ) = P (B 2 )P (B 3 )
1 4
6 6
4
36
1
9
(c)
P ((A2 A3 ) (B 2 A3 )) = P (A2 A3 ) + P (B 2 A3 )
= P (A2 )P (A3 ) + P (B 2 )P (A3 )
5 5 1 2
+
6 6 6 6
27
36
3
4
EJERCICIO 10
Un aficionado usa el siguiente sistema para pronosticar el tiempo atmosferico. Clasifica un
da como seco o mojado y supone que la probabilidad de que un da dado sea igual al anterior
esta dado por p (0 p 1). En base a ciertos registros se sabe que el primer da de Enero
tiene probabilidad (0 1) de ser seco.
Si n = P (n-esimo da del a
no es seco), obtenga una expresion para 2 y 3 en funcion de
y p.
(Hind: Puede ser u
til aplicar probabilidad totales)
SOLUCION:
Definamos como:
Di : El da i-esimo del a
no es seco;
i = 1, 2, . . . , n.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
39
c
P (Di | Di1 ) = p = P (Dic | Di1
)
P (D1 ) =
luego tenemos que
2 = P (D2 ) = P (D2 D1 ) + P (D2 D1c )
2 = P (D2 | D1 )P (D1 ) + P (D2 | D1c )P (D1c )
2 = p P (D1 ) + (1 p) P (D1c )
2 = p + (1 p) (1 )
2 = (2p 1) + (1 p)
Ahora se obtiene de la misma manera 3
3 = P (D3 ) = P (D3 D2 ) + P (D3 D2c )
3 = P (D3 | D2 )P (D2 ) + P (D3 | D2c )P (D2c )
3 = p P (D2 ) + (1 p) P (D2c )
3 = p P (D2 ) + (1 p) (1 P (D2 ))
3 = (2p 1) P (D2 ) + (1 p)
3 = (2p 1) 2 + (1 p)
3 = (2p 1) {(2p 1) + (1 p)} + (1 p)
3 = (2p 1)2 + (2p 1)(1 p) + (1 p)
EJERCICIO 11
En la serie mundial de beisbol, dos equipos A y B juegan una serie de partidos uno contra
otro y el primer equipo que gana un total de tres partidos es el ganador de la serie mundial.
Si la probabilidad de que el equipo A gane un partido contra el equipo B es 31 .
(a) Describa el espacio muestral de este experimento.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
40
Captulo 2. Probabilidad
(b) Cual es la probabilidad de que el equipo A gane la serie mundial?
(c) Si la probabilidad de que el equipo A gane cualquier partido es p (0 < p < 1). Cual
es la probabilidad de que sea necesario jugar los 5 partidos para determinar al ganador
de la serie?
(d) Si la serie termina en el cuarto juego, cual es la probabilidad de que el ganador sea el
equipo B?
SOLUCION
P (S c |C) =
P (S c C)
P (C)
3p(1 p)3
3p(1 p)3 + 3p3 (1 p)
3p(1 p)3
3p(1 p){(1 p)2 + p2 }
(1 p)2
p2 + (1 p)2
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
41
42
Captulo 2. Probabilidad
2.2.
Ejercicios Propuestos
1. Una costura hecha en un avion necesita 25 remaches. La costura tendra que volver a
realizarse si cualquiera de los remaches esta defectuoso. Suponga que los remaches estan
defectuosos independientemente unos de otros, cada uno con la misma probabilidad.
a) Si 14 % de todas las costuras necesitan volver a efectuarse, cual es la probabilidad
de que un remache este defectuoso?
b) Que tan peque
na debe ser la probabilidad de un remache defectuoso para asegurar que solo 10 % de todas las costuras necesiten volver a ejecutarse?
2. Dos bombas conectadas en paralelo fallan independientemente una de la otra en un
da dado. La probabilidad de que la bomba mas vieja falle es 0.10 y la probabilidad de
que solo la bomba mas nueva falle es 0.05. Cual es la probabilidad de que el sistema
de bombeo falle en cualquier da dado (lo que sucedera si ambas bombas fallan)?
3. Se tienen 5 aspirantes (Juan, Dario, Mara, Susana y Natalia) para dos trabajos identicos. Un supervisor selecciona dos aspirantes para ocupar esos puestos.
a) Hacer un lista de los modos posibles en que se pueden ocupar los puestos. Es decir,
hacer una lista de todas las selecciones posibles de dos de los cincos aspirantes.
b) Sea A el conjunto de selecciones que contienen por lo menos un hombre. Cuantos
elementos tiene A?
c) Sea B el conjunto de selecciones que contienen exactamente un hombre. Cuantos
elementos tiene B?
d ) Escribir el conjunto que contiene dos mujeres, en terminos de A y B.
e) Hacer una lista de los elementos en A, AB, A B, y AB.
4. Una compa
na manufacturera tiene dos expendios al menudeo. Se sabe que el 30 % de
los clientes potenciales compran productos solo en la tienda I, el 50 % compra en la
tienda II, el 10 % compra en la tienda I y II, y el 10 % de los consumidores no compra
en ninguna de las dos. Sea A el evento en el que un cliente potencial, seleccionado al
azar, compra en I y B el evento el evento en el que compra en II. Calcular las siguientes
probabilidades:
a) P (A)
b) P (B)
c) P (A B)
d ) P (AB)
e) P (AB)
f ) P (A B)
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
43
44
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
Captulo 2. Probabilidad
Captulo 3
Variables Aleatorias Discretas
3.1.
Ejercicios Resueltos
EJERCICIO 1
Fernando y Nicolas juegan un partido de tenis al mejor de tres sets (esto es, el que gana dos
sets gana el partido). Suponga que la probabilidad de que Fernando gane el primer set es 0,5.
Para los siguientes sets, la probabilidad de que Fernando gane es: 0,5 + (1)Y (0,1)(k 1) ,
k = 2, 3 donde
1, si Fernando perdio el set anterior
Y =
0, si Fernando gano el set anterior
(a) Sea X: N de sets que Fernando perdio. Encuentre la funcion de distribucion de X
(esto es, la tabla).
(b) Calcule la probabilidad de que Fernando gane el partido.
(c) Suponga que la empresa ABCDE le paga a Fernando mil dolares por el encuentro,
pero por cada set que este pierde se le descuentan 100 dolares. Sea G: ganancia obtenida
por Fernando. Encuentre E(G).
Sugerencia: Puede ser u
til para este problema hacer el diagrama de arbol.
SOLUCION
Las posibles secuencia del partido se aprecian en el arbol siguiente:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
46
(a) Definimos X: no set que Fernando perdio con X {0, 1, 2}. Luego las probabilidades
para todos los casos son:
P (X = 0) = P (GG) = 0,5 0,6 = 0,3
P (X = 1) = P (GP G P GG) = 0,5 0,4 0,3 + 0,5 0,4 0,7 = 0,2
P (X = 2) = 1 P (X = 0) P (X = 1) = 1 0,3 0,2 = 0,5
Luego la funcion de distribucion de x es:
X
0
1
2
P (X) 0.3 0.2 0.5
(b) P (Fernando gane el partido) = P (X = 0) + P (X = 1) = 0,3 + 0,2 = 0,5
(c) Sea H:ganancia obtenida por Fernando, por lo tanto H {800, 900, 1000}.
Luego las probabilidades para las ganancias son:
P (H = 800) = P (x = 2) = 0,5
P (H = 900) = P (x = 1) = 0,2
P (H = 1000) = P (x = 0) = 0,3
E(H) =
Rec H
EJERCICIO 2
Sea X: n
umero de neumaticos de un automovil seleccionado al azar, que tengan baja la presion.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
47
(a) Cual de las siguientes tres funciones p(x) es una pmf legtima para x, y por que no se
permiten las otras dos?
x
0
1
2
p(x) 0.3 0.2 0.1
p(x) 0.4 0.1 0.1
p(x) 0.4 0.1 0.2
3
4
0.05 0.05
0.1 0.3
0.1 0.3
SOLUCION
(a) Recordemos que para que una pmf sea legtima debe cumplir con que la suma de ella,
sobre todo el recorrido, resulte 1, y 0 p(x) 1. Luego observando las tres pmf propuestas, podemos observar que las tres tiene valores entre 0 y 1, pero solo la segunda
suma 1.
0,4, x=0;
0,1, x=1;
0,1, x=2;
p(x) =
0,1, x=3;
0,3, x=4;
0,0, e.o.c.
(b) P (2 X 4) = 0,1 + 0,1 + 0,3 = 0,5
P (X 2) = 0,4 + 0,1 + 0,1
P (X 6= 0) = 0,1 + 0,1 + 0,1 + 0,3 = 0,6
(c) Si p(x) es la nueva pmf, debe cumplir que la suma sobre todo su recorrido de 1.
4
X
c(5 x) = 1 c
x=0
4
X
(5 x) = 1 c(5 + 4 + 3 + 2 + 1) = 1 15c = 1 c =
x=0
1
.
15
EJERCICIO 3
Si el 90 % de todos los solicitantes para cierto tipo de hipoteca no llenan correctamente el
formato de solicitud en la primera remision, Cual es la probabilidad de que entre 15 de
estos solicitantes seleccionados al azar:
(a) Por lo menos 12 no la llenen a la primera remision?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
48
SOLUCION
(a) Sea X: n
umero de personas que rellenan erroneamente la solicitud. Luego
X Bin(15, 0,9)
x = 0, 1, 2, ...
15
X
15
x=12
(b)
P (10 X 13) = P (X = 10) + P (X = 11) + P (X = 12) + P (X = 13)
13
X
15
=
0,9x (1 0,9)15x = 0,4488
x
x=10
(c) Sea Y: n
umero de personas que llenan correctamente sus formatos. Luego
Y Bin(15, 0,1)
y = 0, 1, 2, ...
2
X
15
y=0
EJERCICIO 4
El voltaje de una batera nueva puede ser aceptable (A) o no aceptable (B). Cierta linterna de
mano necesita dos bateras, as que estas han de seleccionarse y probarse independientemente
hasta encontrar dos aceptables. Supongamos que el 80 % de todas las bateras tienen voltaje
aceptable y denotemos por Y el n
umero de bateras que deben ser probadas.
(a) Cuanto vale p(2), es decir, P (Y = 2)?
(b) Cuanto vale p(3) ?
(c) Para tener Y=5. Que debe ser cierto de la quinta batera seleccionada?. (Hint: Haga
una lista de los casos favorables de Y=5 y luego determine p(5)).
(d) Utilice el lector del modelo de sus respuestas para las partes (a) a la (c) para obtener
una formula general para p(y).
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
49
SOLUCION
Considerando que una batera es aceptable con probabilidad 0.8 y por ende no aceptable con
probabilidad 0.2:
(a)
P (Y = 2) = P (A A) = 0,8 0,8 = 0,64
(b) En este caso hay dos formas de obtener Y=3:
P (Y = 3) = P (A B A) + P (B A A) = 0,8 0,2 0,8 + 0,2 0,8 0,8 = 0,256
(c) Como se revisa hasta encontrar 2 buenas en voltaje, entonces la quinta obligadamente
debe ser Aceptable (A). La lista de los posibles resultados son:
ABBBA
BABBA
BBABA
BBBAA
Luego calculamos lo pedido:
P (Y = 5) = 0,82 0,23 4 = 0,204
(d) Si observamos la relacion que tienen (a), (b) y (c), podemos rescatar que
P (Y = y) = (y 1)0,82 0,2y2 , y 2
P (Y = y) =
y1
0,82 0,2y2 , y 2
21
50
SOLUCION
Resumiendo los datos entregados, tenemos lo siguiente:
N:25 pelotas
P:15 Penn
W:10 Wilson
n:12 tama
no muestra
Sea X: n
umero de pelotas de las que me sirven, en la muestra sin reposicion, en este caso
pelotas Penn. Luego
N P
P
X Hiper(15, 10, 12) P (X = x) =
nx
N
n
(a)
P (X = 8) =
15
8
10
4
25
12
= 0,2599
(b)
P (X = 0) =
15
0
10
12
25
12
=0
Pues 10
no esta definido, es decir no existe, ya que es ilogico sacar mas pelotas de un
12
tipo de las que tengo, luego es un evento imposible.
EJERCICIO 6
Un artculo de Los Angeles Times (3 de Dic. de 1993) reporta que de cada 200 personas,
una lleva el gene defectuoso que ocasiona cancer de colon hereditario. En una muestra de
1000 personas Cual es la distribucion aproximada del n
umero de quienes llevan este gene?.
Utilice esta distribucion para calcular la probabilidad aproximada de que:
(a) Entre 4 y 7 inclusive, personas lleven el gene.
(b) Por lo menos 8 lleven el gene.
SOLUCION
Por las caractersticas del problema, con X= n
umero de personas con el gene.
X P oisson(5)
(a)
P (4 X 7) = P (X = 4) + P (X = 5) + P (X = 6) + P (X = 7)
=
54 e5 55 e5 56 e5 57 e5
+
+
+
= 0,602
4!
5!
6!
7!
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
51
(b)
P (X 8) =
X
5x e5
x=8
=1
7
X
5x e5
x=0
x!
x!
= 0,133
EJERCICIO 7
Una compa
na telefonica emplea cinco operadoras de informacion que reciben solicitudes de
informacion independientemente una de otra, cada una seg
un un proceso de Poisson con tasa
= 2 minuto.
(a) Cual es la probabilidad de que durante un periodo dado de un minuto, la primera
operadora no reciba solicitudes?
(b) Cual es la probabilidad de que durante un periodo dado de un minuto, exactamente
4 de las 5 operadoras no reciban solicitudes?
(c) Escriba una expresion para la probabilidad de que durante un periodo dado de un
minuto, todas las operadoras reciban exactamente el mismo n
umero de solicitudes.
SOLUCION
Es importante tener presente que las operadoras atienden solicitudes independientemente
una de otra. Luego
Sea X: n
umero de llamadas en un minuto de la operadora x. Por lo tanto
X P oisson(2)
P (X = 0) =
e2 20
= e2 = 0,1353
0!
(b) En este caso tenemos un experimento incluido en el otro, ya que cuando contamos el
n
umero de operadoras que cumplen con algo de entre un total, estamos hablando de
un experimento Binomial, en el cual, la probabilidad del exito esta modelada por la
distribucion Poisson. Luego
Y: n
umero de operadoras que reciben cero llamadas entre las 5
Y Bin(5, P (X = 0)), recuerde que X P oisson(2)
5
P (Y = 4) =
0,13534 (1 0,1353)54 = 0,001451
4
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
52
[P (X = x)]5
x=0
EJERCICIO 8
Para promocionar sus helados de paleta, una fabrica pone cada 15 helados una etiqueta que
dice vale otro. Cualquiera persona que compre un helado y le salga vale otro obtiene
un helado gratis. Estos helados cuestan 100 pesos cada uno. Si Ud. decide comprar estos
helados hasta obtener uno gratis cuanto esperara gastar?
SOLUCION
Sea X: no helados comprados hasta obtener el primero gratis.
De lo anterior de deduce que la variable X tiene distribucion geometrica
X Geometrica(p)
p = P (Salga gratis) =
1
15
SOLUCION
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
53
=1p+
=p+
1
(1 p)
k
(1 p)
k
1p
.
k
Luego
n
p(x) = P (X = x) =
(p)x (1 p)nx ,
x
x = 0, 1, 2, 3, . . . , n.
(b)
Bayes
P (S|C) =
P (C|S)P (S)
P (C)
1p
p+
(1p)
k
kp
(k + 1)p + 1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
54
3.2.
Ejercicios Propuestos
1. Suponga que cada una de las llamadas que hace una persona a una estacion de radio
muy popular tiene una probabilidad de 0.02 de que la lnea no este ocupada. Suponga
que las llamadas son independientes.
a) Cual es la probabilidad de que la primera llamada que entre sea la decima que
realiza la persona?
b) Cual es la probabilidad de que sea necesario llamar mas de cinco veces para
hallar desocupada la lnea?
c) Cual es le n
umero promedio de llamadas que deben hacerse para hallar desocupada la lnea?
2. Un negocio de computadores que atiende pedidos por correo tiene seis lneas telefonicas.
Simbolicemos con correo X el n
umero de lneas con uso en un momento especfico.
Supongamos que la pmf de X estas dada en la tabla siguiente.
x
0
1
2
3
4
5
6
p(x) 0.1 0.15 0.20 0.25 0.20 0.06 0.04
Calcule la probabilidad de cada uno de los siguientes eventos:
a) A lo sumo 3 lneas estan en uso
b) Menos de 3 lneas estan en uso
c) Por lo menos 3 lneas estan en uso
d ) Entre 2 y 5 lneas estan en uso
e) Entre 2 y 4 lneas no estan en uso
f ) Por lo menos 4 lneas no estan en uso
3. Una compa
na de seguros ofrece a sus tenedores de polizas varias opciones diferentes
para el pago de primas. Para un tenedor seleccionado al azar, sea X=n
umero de meses
entre pagos sucesivos. La cdf de X es como sigue:
0,30
0,40
F (x) =
0,45
0,60
si
si
si
si
si
si
x<1
1x<3
3x<4
4x<6
6 x < 12
12 x
a) Cual es la pmf de X?
b) Solo con el uso de la cdf, calcule P (3 X 6) y P (4 X)
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
55
56
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
57
58
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
Captulo 4
Variables Aleatorias Continuas
4.1.
Ejercicios Resueltos
EJERCICIO 1
La dureza Rockwell de un metal se determina al golpear con un punto acerado (herramienta)la superficie del metal y despues medir la profundidad de penetracion del punto. Suponga
que la dureza Rockwell de cierta aleacion esta normalmente distribuida con media de 70 y
desviacion estandar de 3.
(a) Si un especimen es aceptable solo si su dureza esta entre 67 y 75, Cual es la probabilidad de que un especimen seleccionado al azar tenga una dureza aceptable?
(b) Si la escala aceptable de dureza es (70 c, 70 + c), para que calor de c tendra una
dureza aceptable, 95 % de todos los especmenes?
(c) Si la escala aceptable es como el inciso (a) y la dureza de cada diez especmenes
seleccionados al azar se determina independientemente, cual es el n
umero esperado
de especmenes aceptables entre los diez?
(d) Cual es la probabilidad de que a lo sumo ocho de diez especmenes seleccionados
independientemente, tengan una dureza menor a 73.84?
SOLUCION
Sea X: Dureza Rockwell, donde
X N(0, 1)
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
60
67 70
75 70
Z
3
3
5
(1)
=
3
= (1,666) (1)
= 0,9522 0,158
= 0,7935
(b)
P (70 c X 70 + c) = 0,95
P (X 70 + c) P (X < 70 c) = 0,95
P
70 + c 70
Z
3
P
70 c 70
Z<
3
c
3
c
3
= 0,95
= 0,95
c
h
c i
1
= 0,95
3
3
2
c
3
1 = 0,95
c
3
c
3
= 1,95
1,95
= 0,975
2
c
= 1,96
3
c = 1,96 3 = 5,88
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
61
(c) Sea Y: no de especmenes con dureza aceptable de entre 10, siendo para este caso su
distribucion como sigue:
Y Bin(10, 0,7935)
Luego nos piden
E(Y ) = n p = 10 0,7935 = 7,9
(d)
P (X < 73,84) = P
73,84 70
Z<
3
=
3,84
3
= 0,8997
Luego
Y Bin(10, 0,8997)
8
X
10
P (Y 8) =
0,8997i (1 0,8997)10i = 0,265
i
i=0
EJERCICIO 2
La resistencia a la compresion de una serie de muestras de cemento puede modelarse con una
distribucion normal con media 6000 Kg/cm2 y una desviacion estandar de 100 Kg/cm2 .
(a) Cual es la probabilidad de que la resistencia de una muestra sea menor que 6250
Kg/cm2 ?
(b) Cual es la probabilidad de que la resistencia de una muestra se encuentre entre 5800
y 5900 Kg/cm2 ?
(c) Cual es el valor de resistencia que excede el 95 % de las muestras?
SOLUCION
Sea X: Resistencia a la compresion. Luego
X N(6000, 1002 )
(a)
P (X < 6250) = P
6250 6000
Z<
100
=
250
100
= 0,9938
(b)
5800 6000
5900 6000
Z
100
100
5900 6000
100
5800 6000
100
62
X 6000
x 6000
<
100
100
X 6000
100
X 6000
100
= 0,95
= 0,95
= 1,64
SOLUCION
(a)
40
Z
P (X > 35) =
40
f (x)dx =
35
35
(b)
Z
P (X < x) =
P (X < x) = 0,9
Z x
x
f (x)dx =
0,1dx = 0,1 x 0,1 30 = 0,9
30
30
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
63
0,1 x 0,1 30 = 0,9
0,1 x = 3,9
3,9
x=
0,1
x = 39
Luego el tipo de armado que excede al 90 % de los ensambles es el que se demora mas
de 39 segundos en este.
(c) Lo que nos piden es la Esperanza y varianza de la variable tiempo de ensamble.
Entonces calculemos
Z 40
Z
xf (x)dx =
E(X) =
30
40
30
= 35
=
2 30
2
2
40
30
= 1233,33
=
3 30
3
3
2
es decir, 2.88 segundos es el tiempo en promedio que encuentran del valor esperado (35
segundos) los tiempos de ensamble.
EJERCICIO 4
El tiempo X (minutos) para que un asistente de laboratorio prepare el equipo para un
experimento tiene una distribucion Uniforme(25,35).
(a) Escriba la pdf de X y trace su grafica.
(b) Cual es la probabilidad de que el tiempo de preparacion exceda de 33 min.?
(c) Cual es la probabilidad de que el tiempo de preparacion se encuentre a una distancia
a lo mas de 2 min. del tiempo esperado?
(d) Para cualquier a tal que 25 < a < a+2 < 35, Cual es la probabilidad de que el tiempo
de preparacion este entre a y a + 2 minutos?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
64
SOLUCION
X: tiempo para preparar equipo;
X U (25, 35)
(a)
f (X) =
1
,
3525
25 < X < 35
0,
e.o.c.
(b)
Z
35
35
f (x)dx =
P (X > 33) =
33
33
35
E(X) =
35
xf (x)dx =
25
25
= 30
=
2 25
2
2
28
(d) La condicion de que 25 < a < a + 2 < 35, es para poder utilizar la f (x) de la Uniforme
sin salirnos del rango.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
65
a+2
EJERCICIO 5
Sea X la distancia en metros que un animal se mueve desde su lugar de nacimiento hasta el
primer territorio vacante que encuentra. Suponga que para las ratas canguro, X tiene una
distribucion exponencial con parametro = 0,01386 (como lo sugiere el artculo Competition and Dispersal from Multiples Nest, Ecology, 1997, pp. 873-883).
(a) Cual es la probabilidad de que la distancia sea a lo sumo 100 metros?, Entre 100 y
200 metros?
(b) Cual es la probabilidad de que la distancia sea mayor que la distancia promedio en
mas de 2 desviaciones estandar?
(c) Cual es el valor de la mediana de la distancia?
SOLUCION
Tenemos que X exp() con = 0,01386. De esto de puede obtener:
FX (x) = P (X x) = 1 ex
y por ende
P (X > x) = ex
ademas tenemos que
E(X) = X =
2
Var(X) = X
=
1
2
66
3
X>
0,01386
= P (X > 216,450)
= e216,450
= 0,049 0,05
(c) Se pide la mediana, sabemos que esta se encuentra en el percentil 50.
Luego se tiene que
Z
mediana
1 0,5 = emediana
ln(0,5) = mediana
ln(0,5)
0,01386
= mediana
50,01 = mediana
EJERCICIO 6
La presion del aire de un neumatico seleccionado al azar, instalado en un automovil nuevo,
esta normalmente distribuida con valor medio de 31 lb/pulg2 y desviacion estandar de 0.2
lb/pulg2 .
(a) Cual es la probabilidad de que la presion de un neumatico, seleccionado al azar, exceda
de 30.5 lb/pulg2 ?
(b) Cual es la probabilidad de que la presion de un neumatico, seleccionado al azar, se
encuentre entre 30.5 y 31.5 lb/pulg2 ?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
67
(c) Suponga que un neumatico se considera con presion baja si esta debajo de 30.4 lb/pulg2 .
Cual es la probabilidad de que al menos uno de los cuatro neumaticos de un automovil
se encuentre con presion baja?
SOLUCION
Sea X la presion de aire, luego tenemos que
X N (31, 0,22 )
30,531
)
0,2
(b)
P (30,5 < X < 31,5) = P (X < 31,5) P (X < 30,5)
=P
31,5 31
Z<
0,2
P
30,5 31
Z<
0,2
(c) Sea Y : no de neumaticos con presion baja. Se puede deducir que Y Bin(4, p), donde
p = P (X < 30,4).
Luego calculando tenemos que
p = P (X < 30,4) = P
30,4 31
Z<
0,2
= P (Z < 3) = 0,0013
Y Bin(4, 0,0013)
Se pide
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
68
P (Y 1) = 1 P (Y < 1)
= 1 [P (Y = 0)]
4 0
=1
p (1 p)4
0
= 1 [1 0,0013]4
= 0,005189
EJERCICIO 7
Suponga que el n
umero de horas X que funcionara una maquina antes de fallar es una variable aleatoria con distribucion Normal de parametros = 720 y 2 = 482 .
Suponga que en el momento en que la maquina comienza a funcionar Ud. debe decidir
cuando el inspector regresara a revisarla. Si el vuelve antes de que la maquina falle, se
ocasiona un costo de a dolares por haber desperdiciado una inspeccion. Si vuelve despues de
que la maquina haya fallado, se ocasiona un costo de b dolares por el no funcionamiento de
la maquina.
(a) Determine una expresion para el costo esperado, considerando que el tiempo hasta que
el inspector vuelve a inspeccionar la maquina es de t horas.
(b) Suponga que el inspector decide volver en un tiempo de t = 816hrs. Calcule la probabilidad de que el inspector llegue tarde a la inspeccion, es decir, la maquina ya ha
dejado de funcionar.
(c) Se observa este proceso durante 15 perodos. Determine de que el inspector llegue tarde
mas de 12 veces.
SOLUCION
Sea X : Tiempo de funcionamiento de una maquina hasta que falle.
X N (720, 482 )
(a) Tenemos que
Costo =
a X>t
b X<t
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
69
t 720
48
(b)
X 720
816 720
<
48
48
96
Z<
48
P (X < 816) = P
=P
= P (Z < 2)
= 0,9772499
(c) Sea X : N
umero de veces que el inspector llega tarde.
X Bin(15, 0,9772499)
entonces
P (X > 12) =
15
X
15
x=13
(0,9772499)x (1 0,9772499)15x
= 0,9956363
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
70
4.2.
Ejercicios Propuestos
71
b) Encuentre el valor k.
c) Cual es la probabilidad de que el peso de apoyo sea mayor que el peso especificado?
d ) Cual es la probabilidad de que el peso difiera del peso especificado en mas de .5
gr.?
6. El artculo The Prediction of Corrosion by Statistical Analysis of Corrosion Profiles
sugiere la siguiente cdf, para la profundidad X de la picadura mas profunda en un
experimento donde interviene la exposicion de acero al manganeso carbono a agua de
mar acidulada:
(x)/
F (x; , ) = ee
< x <
Los autores proponen los valores = 150, = 90. Suponga que este es el modelo
correcto.
a) Cual es la probabilidad de que la profundidad de la picadura mas profunda sea
a lo sumo 150? A lo sumo 300? Entre 150 y 300?
b) Cual es la funcion de densidad de X?
c) Se puede demostrar que E(X) ,5772 + . Cual es la media para los valores
dados y , y como se compara con la mediana?
7. El tiempo en minutos en ir de un hotel al aeropuerto por la ruta A se distribuye
N (27, 25). Mientras que por la ruta B se distribuye N (30, 4).Que ruta conviene utilizar
si se dispone de:
a) 30 minutos?
b) 34 minutos?
8. Si X tiene una distribucion exponencial con parametro , derive una expresion general
para el (100p) avo percentil de la distribucion. Luego especifique como obtener la
mediana.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
72
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
Captulo 5
Sensibilidad y Especificidad
5.1.
Ejercicios Resueltos
EJERCICIO 1
En una investigacion sobre el factor de crecimiento de carcinoma mamario (FCCM), el estudio piloto revelo que estaba elevado en los pacientes con carcinomas de mama confirmados.
Se hizo un estudio clnico que incluyo a 1600 pacientes donde por biopsia se determino carcinoma en 600 y 1000 estaban sanos. Se considero como positivo al FCCM un resultado mayor
o igual a 150 unidades por litro. La tabla obtenida fue la siguiente:
Con carcinoma de mama
FCCM (+)
570
FCCM (-)
30
Total
600
74
SOLUCION
VP
570
# de realmente enf ermos
=
=
= 0,35625
# total de individuos
T otal
1600
570
570
VP
=
=
= 0,95
V P + FN
570 + 30
600
VN
850
850
=
=
= 0,85
V N + FP
850 + 150
1000
75
V PP =
V PN =
570
570
VP
=
=
= 0,79167
V P + FP
570 + 150
720
850
850
VN
=
=
= 0,9659
V N + FN
850 + 30
880
SOLUCION
Sean
E : Vaca enferma
S : vaca sin enfermedad
+ : Examen positivo
: Examen negativo
donde las probabilidades son:
P (E) = 0,001
P (S) = 0,999
P (+|E) = 0,9
P (|S) = 0,01
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
76
P (+|E)P (E)
P (+|S)P (S) + P (+|E)P (E)
0,01 0,999
0,9 0,001 + 0,9 0,001
= 0,0826446
A esta probabilidad se le llama usualmente la valor predictivo positivo
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
5.2.
Ejercicios Propuestos
Prueba (+)
Prueba (-)
Total
donde
En 34 personas con meningitis meningococica la PCR fue positiva (Verdaderos
Positivos).
En 5 personas con meningitis meningococica la PCR fue negativa (Falsos Negativos).
En 75 personas sin meningitis meningococica la PCR fue negativa (Verdaderos
Negativos).
En 1 persona sin meningitis meningococica la PCR fue positiva (Falsos Positivos).
Responda lo siguiente:
a) Que es la Prevalencia? Calc
ulela.
b) Cual es la probabilidad de que un sujeto enfermo sea clasificado como positivo?,
Como se podra aumentar esta probabilidad?
c) Cual es la probabilidad de que un sujeto sano sea clasificado como negativo?,
Como se podra aumentar esta probabilidad?
d ) Cual es la probabilidad de que el individuo tenga meningitis meningococica si la
prueba es positivo?, cual es la probabilidad de que no la padezca si la prueba es
negativa?
2. Con el objeto de diagnosticar la colelietasis se usan los ultrasonidos. Tal tecnica tiene
una sensibilidad del 91 % y una especificidad del 98 %. En la poblacion que nos preocupa, la probabilidad de colelietasis es de 0,2.
a) Si a un individuo de tal poblacion se le aplican los ultrasonidos y dan positivos,
cual es la probabilidad de que sufra la colelietasis?
b) Si el resultado fuese negativo, cual sera la probabilidad de que no tenga la
enfermedad?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
77
78
Tabla A
Enfermos
Examen Si No Total
(+)
58 4
62
(-)
12 28
40
Total
70 32
102
Tabla B
Enfermos
Examen Si No Total
(+)
58 40
98
(-)
12 280 292
Total
70 320 390
a) Calcule y comente para cada una de ellas su Prevalencia, Sensibilidad y Especificidad.
b) Para la Tabla A conociendo la sensibilidad y la especificidad del examen diagnostico calcule aplicando el Teorema de Bayes: VPPP (valor predictivo de la prueba
positiva) y VPPN (valor predictivo de la prueba negativa), comente.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
Captulo 6
Estimaci
on
6.1.
Ejercicios Resueltos
EJERCICIO 1
Suponga que se tiene una m.a. de tama
no 2n tomada de una poblacion X, con E(X) = y
V ar(X) = 2 . Sean:
2n
n
1 X
1X
X1 =
xi y X 2 =
xi
2n i=1
n i=1
dos estimadores de . Cual es el mejor estimador de ? Explique su eleccion.
SOLUCION
El mejor estimador sera aquel que tenga menor error cuadratico medio E.C.M.. Primero
veamos si son insesgados los estimadores.
!
2n
2n
X
1 X
1
1
E
xi =
2n =
E(X 1 ) =
E(xi ) =
2n
2n
2n
i=1
i=1
!
n
n
X
1
1X
1
E(X 2 ) = E
xi =
E(xi ) = n =
n
n i=1
n
i=1
Luego ambos estimadores son insesgados, por lo tanto el mejor estimador de entre los dos,
sera aquel que tenga menor varianza.
!
2n
2n
X
1
1 X
1
2
V ar(X 1 ) = 2 V ar
xi = 2
V ar(xi ) = 2 2n 2 =
4n
4n i=1
4n
2n
i=1
!
n
n
X
1
1 X
1
2
2
V ar(X 2 ) = 2 V ar
xi = 2
V ar(xi ) = 2 n =
n
n i=1
n
n
i=1
Luego, como el que tiene menor varianza es X 1 , escogemos este, pues es el que produce un
menor E.C.M.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
80
Captulo 6. Estimaci
on
EJERCICIO 2
1 y
2 son estimadores insesgados del parametro . Se sabe que V ar(
1 ) = 10
Suponga que
SOLUCION
Como ambos son insesgados, el mejor estimador sera aquel que tenga menor varianza, lo
2 tiene
que, en este caso, conlleva a tener un menor E.C.M.. Luego observando, vemos que
1 , por lo tanto escogemos
2 como mejor estimador de .
menor varianza que
EJERCICIO 3
1 y
2 son estimadores del parametro . Se sabe que E(
1 ) = , E(
2) = ,
Suponga que
2
1 ) = 10 y V ar(
2 ) = 4. Cual es el mejor y en que sentido lo es?
V ar(
SOLUCION
1 es insesgado para pero que
2 no lo es.
Si observamos cuidadosamente, vemos que
Ahora la mejor forma de ver cual es mejor es comparando los E.C.M. de cada uno, ya que
esta medida considera el sesgo producido por cada estimador y la varianza que tienen.
1 ) = V ar(
1 ) + Sesgo2 (
1 ) = 10 + 02 = 10
E.C.M.(
2
2
=4+
E.C.M.(2 ) = V ar(2 ) + Sesgo (2 ) = 4 +
2
2
Como se puede ver, el E.C.M. de 2 depende del verdadero valor que tiene , luego debemos
2 sera mejor que
1.
hacer un analisis mas detallado, para saber cuando
Cuando ocurre:
1 ) E.C.M.(
2)
E.C.M.(
2
10 4 +
2
16 + 2
10
4
40 16 + 2
2 40 16
2 24
2 sera mejor estimador de que
1 cuando el verdadero valor de sea:
Es decir,
24 o cuando 24
1 sera mejor estimador de que
2 cuando
Equivalentemente,
24 < < 24
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
81
EJERCICIO 4
Sea X1 , . . . , Xn una muestra aleatoria de tama
no n, de una poblacion N (, 2 ).
2
SOLUCION
N (, 2 ), luego si queremos demostrar
(a) Como X N (, 2 ) entonces se sabe que X
n
2 es sesgado para 2 ocupamos la siguiente relacion:
que X
2
E(X ) =
2
+ 2
n
Sesgo(X ) = E(X ) 2
2
Sesgo(X ) =
2
2
+ 2 2 =
n
n
2
n
0, es decir, el estimador
EJERCICIO 5
Una maquina produce artculos defectuosos con probabilidad . En la inspeccion de artculos
se define la v.a.
Yi =
1, si el artculo i es defectuoso;
0, si el artculo i no es defectuoso.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
82
Captulo 6. Estimaci
on
En una muestra de tama
no 5 se observan dos artculos defectuosos. Proponga un modelo
apropiado para el problema y estime la proporcion de artculos defectuosos usando el metodo
de maxima verosimilitud.
SOLUCION
Dada la definicion del problema y la estructura de la variable aleatoria, Y tiene una distribucion Bernoulli
Y Ber(p) P (Y = y) = py (1 p)1y
donde el parametro p, que es la probabilidad del exito, es desconocida, por lo que la estimaremos por maxima verosimilitud.
L(y|p) =
L(y|p) = p
5
Y
i=1
P5
i=1
pyi (1 p)1yi
yi
(1 p)5
P5
i=1
yi
i=1
p =
yi
i=1
5
Pero como nos dicen que se observaron dos artculos defectuosos, es decir solo dos de los yi
son 1, la suma de estos es 2,
2
p =
5
EJERCICIO 6
El n
umero de conexiones mal soldadas por microcircuito integrado en una operacion de
manufactura electronica sigue una distribucion Binomial(20,p) con p desconocida. El costo
de corregir los errores, por microcircuito, es:
C = 3X + X 2
En base a una muestra aleatoria X1 , X2 , ..., Xn encuentre el EMV del costo esperado de
corregir los errores de estos n microcircuitos observados.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
83
SOLUCION
Considerando que el parametro p es desconocido, debemos estimarlo, lo que haremos por el
metodo de Maxima Verosimilitud.
L(x|p) =
n
Y
20
i=1
L(x|p) = p
Pn
i=1 xi
xi
pxi (1 p)20xi
20n
(1 p)
Pn
i=1 xi
n
Y
20
i=1
xi
X
n
xi ln(p) + 20n
i=1
n
X
xi ln(1 p) +
i=1
n
X
i=1
20
ln
xi
p =
xi
i=1
20n
Ya teniendo este estimador, lo que sigue es calcular el EMV del costo.
E(C) = 3E(X) + E(X 2 )
= 3np + np(1 p) + (np)2
= 3np + np np2 + n2 p2
= 4np + np2 (n 1)
[ = 4nb
Luego el E.M.V. de E(C) es E(C)
p + nb
p2 (n 1) por invarianza del E.M.V.
EJERCICIO 7
En encuestas, es difcil obtener respuestas precisas a preguntas delicadas tales como Has
usado alguna vez herona? o Has hecho trampa alguna vez en un examen?. Warner introdujo
el metodo de respuestas aleatorizadas para tratar tales situaciones. El encuestado hace girar
una flecha en una rueda o extrae una bola desde una urna que contiene dos bolas de dos
colores para determinar cual de las dos afirmaciones contestara: (1)Tengo la caracterstica
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
84
Captulo 6. Estimaci
on
A, o (2)No tengo la caracterstica A. El encuestador no conoce cual afirmacion sera contestada pero solamente anotara un s o un no. Se cree que es mas probable que el encuestado
responda verazmente si el o ella saben que el encuestador no conoce cual afirmacion sera contestada. Sea R la proporcion de una muestra que contesta S. Sea p la probabilidad que la
afirmacion 1 sea contestada (p es conocido desde la estructura del metodo aleatorizado), y
sea q la proporcion de la poblacion que tiene la caracterstica A. Sea r la probabilidad que
un encuestado responda s.
(a) Muestre que r = (2p 1)q + (1 p)
(b) Si r es conocida, Como podra determinarse q?
SOLUCION
Definamos como:
R: Proporcion de la muestra que contesta s.
p: Probabilidad que la afirmacion 1 sea contestada.
q: Probabilidad de la poblacion que tiene la caracterstica A.
r: Probabilidad que un encuestado responda si.
(a)
r = P (responda s)
= P (responda s | contesta afirmacion 1)P (contesta afirmacion 1)
+ P (responda s | no contesta afirmacion 1)P (no contesta afirmacion 1)
= pq + (1 p)(1 q)
= pq + 1 p q + pq
= 2pq + 1 p q
= (2pq + 1)q + (1 p)
(b) Sera cosa de despejar q, es decir,
r (1 p) = (2p 1)q
luego
q=
r+p1
2p 1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
85
EJERCICIO 8
Supongase que X1 , X2 , ..., Xn constituyen una m.a. de una distribucion cuya funcion densidad
es la siguiente
1
x , 0 < x < 1;
f (x|) =
0,
e.o.c.
Ademas, supongase que el valor de es desconocido ( > 0).
(a) Determine el EMV de .
(b) Determine el EMV de E(X).
SOLUCION
(a)
L(x1 , . . . , xn , ) =
n
Y
x1
i
i=1
n
Y
= n
!1
xi
/ ln
i=1
`(x1 , . . . , xn , ) = n ln + ( 1)
n
X
ln xi
i=1
`(x1 ,...,xn ,)
n
X
ln xi
i=1
bEM V
n
= X
n
ln xi
i=1
(b)
Z
E(X) =
xx
0
\=
Luego E(X)
+1
1
1
Z
dx =
x dx =
x+1 1
=
0 +1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
86
Captulo 6. Estimaci
on
EJERCICIO 9
Sean X1 , X2 , . . . , Xn variables aleatorias i.i.d. con funcion densidad dada por
( + 1)x ;0 < x < 1
fX (x) =
0
;e.o.c.
(a) Encuentre el estimador de por el metodo de momentos.
(b) Encuentre el estimador de por el metodo de maxima verosimilitud.
(c) Eval
ue ambos estimadores usando los siguientes datos:
X
0.1 - 0.3 0.3 - 0.6 0.6 - 0.7 0.7 - 0.9
Frecuencia
3
1
2
3
SOLUCION
Z
xfX (x)dx =
x ( + 1)x dx
Rec X
Rec X
Z
= ( + 1)
x+1 dx
= ( + 1)
+1
+2
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
x+2 1
+2 0
87
Luego
E(X) = X
+1
=X
+2
+ 1 = X + 2X
(1 X) = 2X 1
M M =
2X 1
1X
(b)
L(x, ) =
n
Y
n
n
Y
Y
f (xi ) =
( + 1)xi = ( + 1)n
xi
i=1
i=1
`(x, ) =n ln( + 1) +
i=1
n
X
ln(xi )
i=1
X
n
`
=
+
ln(xi ) = 0
+ 1 i=1
n
X
n
=
ln(xi )
+1
i=1
+1=
n
n
X
ln(xi )
i=1
M V
=
+
1
n
ln(xi )
i=1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
!
\ ln
88
Captulo 6. Estimaci
on
(c) Para evaluar los estimadores necesitamos convertir los datos tabulados a un set de
datos compuestos por las marcas de cada clases
(0.2)
(0.45)
(0.65)
(0.8)
0.1 - 0.3 0.3 - 0.6 0.6 - 0.7 0.7 - 0.9
X
Frecuencia
3
1
2
3
Se puede representar el conjunto de valores para X como:
[X : 0,2; 0,2; 0,2; 0,45; 0,65; 0,65; 0,8; 0,8; 0,8]
Calculando ahora lo necesario para poder evaluar los estimadores con estos datos tabulados
k
1X
1
X=
mi fi = (0,2 3 + 0,45 1 + 0,65 2 + 0,8 3) = 0,5277
n i=1
9
n
X
ln(xi ) = ln
i=1
n
Y
!
= ln(0,000778752) = 7,15781
xi
i=1
Luego al evaluar estos resultados en los estimadores, estos toman los siguientes valores:
M M =
M V
2X 1
2 0,52777 1
= 0,117612
=
1 0,52777
1X
9
n
= n
+ 1 =
+ 1 = 0,257367
7,15781
X
ln(xi )
i=1
EJERCICIO 10
Sean X1 , ..., Xn , Y1 , ..., Yn v.a. independientes con Xi Exp( 1 ) e Yj Exp( 1 ), con
i = 1, ..., n; j = 1, ..., n. Se define el parametro = (1 , 2 ) por 1 = y 2 = .
(a) Determine los EMV (estimador maximo verosmil) para 1 y 2
(b) Encuentre el sesgo y el ECM (error cuadratico medio) de 1
SOLUCION
(a) Dada la independencia existente entre las variables, tenemos que la densidad conjunta
yi
xi
es fXi ,Yj (xi , yj ) = 1 e 1 e , luego la verosimilitud conjunta es la siguiente:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
89
L() =
xi
1
e
n n
`() =
xi
yi
yi
\ ln
n ln() n ln() \
= 0
= x = 1
= 0 = y
xi
2
yi
2
Tenemos que por la invarianza de los EMVs, 2 = , luego reemplazando queda que 2 = xy .
n
X
xi
n
n
i=1 1 X
1X
E(1 ) = E
E(xi ) =
=
=
n i=1
n n i=1
Luego como es insesgado (recuerde que 1 = ), el Sesgo(1 ) = 0.
Por lo tanto para calcular el ECM (1 ) basta calcular su varianza.
n
X
!
xi
n
X
i=1
1
V ar(1 ) = V ar
xi
n = n2 V ar
i=1
ind
2
n
n
n
1 X
1 X 2 2
V
ar(x
)
=
=
i
n2 i=1
n2 i=1
n
n
el cual 0.
EJERCICIO 11
Sean X1 , ..., Xn iid con densidad e
x 0,
n 2. Sea Sn =
n
X
i=1
z n1 ez
,
(n 1)!
=
Utilice esto para calcular el sesgo y el ECM de
z0
n1
.
Sn
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
Xi . Es bien conocido
90
Captulo 6. Estimaci
on
SOLUCION
n1
1
=E
= (n 1)E
= (n 1)E
E()
n
n
n
X
X
X
xi
xi
xi
i=1
i=1
i=1
1
= (n 1)E
= (n 1)E
Z
Z
= (n 1)E(Z 1 )
Z
= (n 1)
1 z
e
dz = (n 1)
(n 1)!
(n 1)
=
n1
Z
0
n1 z
Z
0
z n2 ez
dz
(n 1)!
z n2 ez
dz =
(n 2)!
= V ar()
= E(
2 ) E 2 ()
ECM ()
=E
n1
Sn
2 !
2
Z2
= (n 1) E
= 2 (n 1)2 E(Z 2 ) 2
= (n 1)
z 2
z n1 ez
dz 2
(n 1)!
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
91
2 (n 1)2
=
(n 1)(n 2)
=
Por lo tanto el ECM ()
2 (n 1)
2
(n 2)
2
n2
2 n
n2
Z
0
z n3 ez
dz 2
(n 3)!
0.
EJERCICIO 12
iid
SOLUCION
Si T corresponde al Maximo, entonces su funcion densidad es de la forma fT (t) = n[FY (t)]n1 fY (t),
donde fY (t) = 1 y FY (t) = t .
(a) Calcularemos la esperanza para determinar el insesgamiento.
E(cT ) = cE(T )
Z
=c
tn
0
cn
= n
=
Luego si c =
n+1
,
n
Z
0
tn1 1
dt
n1
tn dt =
cn tn+1
n n + 1 0
cn n+1
cn
=
n
n+1
n+1
cT es insesgado.
(b) En primer lugar calcularemos lo necesario para obtener el ECM y as despues encontrar
el c que lo minimice.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
92
Captulo 6. Estimaci
on
=c
tn1 1
c2 n
t n n1 dt = n
c2 n
= n
tn+2
n+2 0
=
tn+1 dt
c2 n2
n+2
= c n
= c n
= c n
n
1
n + 2 (n + 1)2
(n + 1)2 n(n + 2)
(n + 1)2 (n + 2)
1
(n + 1)2 (n + 2)
cn n 1
n+1
c2 n2
+ 2
(n + 1)2 (n + 2)
(cn n 1)2
(n + 1)2
Ahora utilizando los metodos matematicos (1a Derivada) para minimizar, encontraremos el
c correspondiente.
ECM ()
2cn2
22 n(cn n 1)
=
+
=0
c
(n + 1)2 (n + 2)
(n + 1)2
n+2
n+1
Para verificar si realmente es mnimo, se calcula la segunda derivada.
c =
2 ECM ()
2n2
=
c2
n+2
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
93
n+2
,
n+1
se minimiza.
el ECM ()
EJERCICIO 13
Suponga que X sigue una distribucion de Pareto, su funcion de densidad esta dada por:
f (x|, ) = x1 , x y
SOLUCION
Como los Xi siguen distribucion de Pareto, se tiene que su esperanza y varianza son conocidas:
E(X) =
,
1
>1
V ar(X) =
2
,
( 1)2 ( 2)
>2
1X
=
Xi
1
n i=1
=X
1
X = X
X
X
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
94
Captulo 6. Estimaci
on
(b) Teniendo que las observaciones distribuyen Pareto, la funcion de verosimilitud es la
siguiente:
L(, ) =
n
Y
(+1)
xi
i=1
= n n
n
Y
!(+1)
\ ln
xi
i=1
n
X
ln(xi ) \
i=1
+ n ln()
n
X
ln(xi ) = 0
i=1
n ln()
n
X
ln(xi )
i=1
EJERCICIO 14
Sea Y1 , ..., Yn una muestra aleatoria proveniente de una poblacion N (, ), con > 0 y desconocido. A partir de una muestra aleatoria correspondiente a 25 pesos de circuitos, con
n
n
X
X
Yi = 1264 y con
Yi2 = 5240, determine la estimacion maximo verosimil de .
i=1
i=1
SOLUCION
L() =
n
Y
i=1
exp
2
1
(yi )2
2
(
n
2
= (2)
1
exp 2
n
X
)
(yi )2
i=1
`() = n2 ln(2)
n
2
ln()
1
2
n
X
i=1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
(yi )2
\ ln
n2
95
ln(2)
n
2
ln()
1
2
n
X
(yi2 2yi + 2 )
i=1
= n2 ln(2)
n
2
ln()
1
2
n
X
yi2 +
i=1
n
2
1
22
n
X
yi2
i=i
n +
yi2
2
n
X
n
X
yi
i=1
n2
\
2
n
=0
2
n=0
\ 2
yi2 n2 = 0
\ n1
i=1
n
X
yi2 /n + 2 = 0
i=1
2 + y 2 = 0
1+4y 2
2
EJERCICIO 15
Ingenieros electricos japoneses han inventado un sistema de radar llamado detector de blancos
moviles (MTD, moving target detector), dise
nado para rechazar los ecos parasitos provocados por el terreno, la lluvia, las aves y otras fuentes de interferencia.
Los investigadores han demostrado que la magnitud X de la frecuencia Doppler de una se
nal
recibida por radar se puede modelar por una distribucion Weibull, con parametro = 2 y
> 0, tal que:
1 2
2x
exp x
f (x) =
x>0
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
96
Captulo 6. Estimaci
on
SOLUCION
L() =
n
Y
2xi
i=1
2n
n
exp
1 2
x
i
n
Y
n
1X 2
xi exp
xi
i=1
i=1
n
X
ln(xi )
i=1
n
X
`
= n +
n
X
n
1X 2
x \
i=1 i
x2i
i=1
2
=0
x2i
i=1
n
n
X
\ ln
x2i
i=1
n
97
SOLUCION
Dado que Xi Geom(p) tenemos que:
P (X = x) = p(1 p)x1 ;
E(X) =
1
p
V ar(X) =
1
=
p
p =
xi
i=1
n
n
n
X
=
xi
1
x
i=1
L(p) =
n
Y
p(1 p)xi 1
i=1
n
X
n
= p (1
(xi 1)
p) i=1
n
X
xi n
= p (1 p) i=1
n
X
`(p) = n ln(p) + (
xi n) ln(1 p)
i=1
= n ln(p) +
n
X
xi ln(1 p) n ln(1 p)
i=1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
1
p2
98
Captulo 6. Estimaci
on
n
X
xi
n
n
`
i=1
=
+
=0
p
p
1p
1p
n
X
n
=
p
xi n
i=1
1p
n
X
n(1 p) = p
!
xi n
i=1
p =
n
n
X
xi
i=1
(c) Recordando la propiedad de invarianza que tienen los estimadores maximo verosmiles,
lo que se pide, se puede traducir estadsticamente en:
P (X > 2) = 1 P (X 2)
= 1 P (X = 1) P (X = 2)
= 1 p(1 p)11 p(1 p)21 = 1 p p(1 p)
= (1 p)2 = 0,261
EJERCICIO 17
Sean X1 , . . . , Xn i.i.d. U (1 , 2 ). Es decir, la densidad de Xi es:
f (x) =
1
2 1
1 x 2
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
99
SOLUCION
(a) Se necesita encontrar los estimadores de 1 y 2 , luego por ser dos parametros, utilizaremos el primer y segundo momento para armar un sistema de ecuaciones.
Momentos poblacionales:
E(X) =
1 + 2
2
Z
E(X ) =
1
x2
1
dx
2 1
22 + 2 1 + 12
=
3
Igualando momentos poblacionales con muestrales, queda el siguiente sistema de ecuaciones:
1 + 2
=x
2
(1)
22 + 2 1 + 12
= x2
3
(2)
(2x 2 ) + (2x 2 )2 +
4x 4x2 +
22
+ 2x2
22
22
22
x2i
n
P
=3
x2i
n
P
=3
2x
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
100
Captulo 6. Estimaci
on
(b) En el caso de aquellas distribuciones en que su dominio depende de los parametros a
estimar (en este caso la distribucion es valida cuando 1 x 2 ), el procedimiento de
estimacion debe considerar un muy peque
no detalle como se muestra a continuacion:
L(1 , 2 ) =
1
I( , ) (x1 ) . . . I(1 ,2 ) (xn )
(2 1 )n 1 2
n
Y
1
I( , ) (xi )
=
(1 , 2 )n i=1 1 2
n
Y
1
=
I(x > ) (xi )I(xi <2 ) (xi )
(1 , 2 )n i=1 i 1
n
Y
1
I(min(xi )>1 ) (xi )I(max(xi )<2 ) (xi )
=
(1 , 2 )n i=1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
6.2.
101
Ejercicios Propuestos
210,07
100,85
66,24
114,79
302,74
311,13
203,24
89,59
247,11
109,11
280,55
150,58
108,91
185,36
299,87
330,33
145,11
262,09
178,21
126,94
109,64
85,54
95,36
477,08
102
Captulo 6. Estimaci
on
Sea X = n
umero de ara
nazos en una pieza seleccionada al azar y suponga que X tiene
una distribucion de Poisson con parametro .
a) Encuentre un estimador de y calcule la estimacion para los datos anteriores.
(Sugerencia: E(X) = para X P ois(), por lo que E(X) =?)
b) Cual es la desviacion estandar (error estandar) de su estimador? Calcule el error
estandar estimado. (Sugerencia: X = para X P ois() .)
4. De n1 fumadores (hombres) seleccionados al azar, X1 fumaron cigarrillos con filtro,
mientras que de n2 fumadoras seleccionadas al azar, X2 fumaron cigarrillos con filtro.
Represente por p1 y p2 las probabilidades de que un hombre y una mujer seleccionados
al azar, respectivamente, fumaron cigarrillos con filtro.
a) Demuestre que (X1 /n1 )(X2 /n2 ) es un estimador insesgado para p1 p2 . (Sugerencia:
E(X) = ni pi . para i = 1, 2.)
b) Cual es el error estandar del estimador en el inciso a)?
c) Como se utilizaran los valores observados x1 y x2 para estimar el error estandar
de su estimador?
d ) Si n1 = n2 = 200, x1 = 127 y x2 = 176, utilice el estimador del inciso a) para
obtener una estimacion de p1 p2 .
e) Utilice el resultado del inciso c) y los datos del inciso d) para estimar el error
estandar del estimador.
5. Considere una muestra aleatoria X1 , . . . , Xn de la pdf
f (x; ) = 0,5(1 + x)
1 x 1
103
x x2 /(2)
e
;x > 0
a) Se puede demostrar que E(X 2 ) = 2. Utilice este hecho para construir un estimador insesgado de con base en Xi2 y use las reglas para demostrar que es
insesgado.
b) Estime de las siguientes n = 10 observaciones sobre el esfuerzo vibratorio de
una paleta de turbina bajo condiciones especficas:
16,88 14,23
10,23 19,87
4,59 9,40
6,66 6,51
13,68 10,95
8. Suponga que el verdadero valor promedio de crecimiento de un tipo de planta, durante un periodo de un a
no, es identico al de un segundo tipo, pero la varianza de
crecimiento para el primer tipo es 2 , mientras que para el segundo tipo la varianza es 4 2 . Sean X1 , . . . , Xm las m observaciones independientes de crecimiento en el
primer tipo (entonces, E(Xi ) = , V (Xi ) = 2 ).Sean Y1 , . . . , Yn las n observaciones
independientes de crecimiento en el segundo tipo (E(Yi ) = , V (Yi ) = 4 2 ).
a) Demuestre que para cualquier entre 0 y 1, el estimador
b = X + (1 )Y es
insesgado para .
b) Para m y n fijas, calcule V (b
) y luego encuentre el valor de que reduzca V (b
)
al mnimo. (Sugerencia: derive V (b
) con respecto a .)
9. Se selecciona una muestra aleatoria de n cascos para ciclistas, fabricados por cierta
compa
na. Sea X = n
umero entre los n que tienen defectos y p = P(con defectos).
Suponga que solo se observa X, en lugar de las secuencia de las S y las F .
a) Obtenga el estimador de maxima verosimilitud de p. Si n = 20 y x = 3, cual es
la estimacion?
b) Es insesgado el estimador del inciso a)?
c) Si n = 20 y x = 3, cual es el EMV de la probabilidad (1 p)5 de que ninguno
de los siguientes cinco cascos que se examinen tengan defectos?
10. Se observan dos sistemas diferentes de computadora durante un total de n semanas.
Represente con Xi el n
umero de descomposturas del primer sistema durante la i-esima
semana y suponga que las Xi son independientes y obtenidas de una distribucion de
Poisson con parametro 1 . De forma similar, represente con Yi el n
umero de descomposturas del segundo sistema durante la i-esima semana y suponga independencia en cada
Yi de Poisson, con parametro 2 . Obtenga los EMV de 1 , 2 y 1 2 . (Sugerencia:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
104
Captulo 6. Estimaci
on
mediante el uso de independencia, escriba la pdf conjunta (verosimilitud) de las Xi , y
Yi juntas.)
11. Se determina la resistencia al corte de cada una de diez soldaduras electricas por puntos
de prueba, obteniendose los siguientes datos (lb/pulg 2 ):
392 376 401 367 389 362 409 415 358 375
a) Si se supone que la resistencia al corte esta normalmente distribuida, estime el
verdadero promedio de resistencia al corte y su desviacion estandar con el metodo
de maxima verosimilitud.
b) Otra vez, suponiendo una distribucion normal, estime el valor de resistencia abajo
del cual 95 % de todas las soldaduras tendran sus resistencias. (Sugerencia: cual
es el percentil 95 en terminos de y ? Ahora utilice el principio de invarianza.)
12. Consulte el ejercicio anterior. Suponga que decidimos examinar otra soldadura por
puntos de prueba. Sea X = resistencia al corte de la soldadura. Utilice la informacion
dada para obtener el EMV de P (X 400). (Sugerencia: P (X 400) = ((400
)/).)
13. Represente por X1 , . . . , Xn una muestra aleatoria de la distribucion de Rayleigh con la
funcion de densidad dada en el ejercicio 7. Determine:
a) El estimador de maxima verosimilitud de y despues calcule la estimacion para
los datos de esfuerzo vibratorio proporcionados en ese ejercicio. Es este estimador
el mismo que el insesgado sugerido en el ejercicio 7?
b) El EMV de la mediana de la distribucion del esfuerzo vibratorio. (Sugerencia:
primero exprese la mediana en terminos de .)
14. En el tiempo t = 0 se ponen a prueba 20 componentes identicos. La distribucion de
duracion de cada uno es exponencial con parametro . El experimentador sale entonces
de la planta de prueba, la cual queda sin vigilancia, y a su regreso, 24 horas despues,
termina de inmediato la prueba, despues de observar que y = 15 de los 20 componentes
todava estan en operacion (es decir, 5 fallaron). Obtenga el EMV de . (Sugerencia:
sea Y = n
umero que resistio 24 horas. Entonces, Y Bin(n, p). Cual es el EMV de
p? Ahora observe que p = P (X 24) donde Xi esta distribuida exponencialmente.
Esto relaciona con p, de modo que la primera se puede estimar una vez que la u
ltima
se haya estimado.)
15. Sea X1 , X2 , . . . , Xn una muestra aleatoria tomada de una distribucion gamma con
parametros r y .
a) Encuentre la funcion y el log de la verosimilitud.
b) Encuentre las ecuaciones de definen los estimadores de maxima verosimilitud para
r y . Pueden resolverse de manera explcita?
c) Demuestre que el estimador de maxima verosimilitud de =
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
es
= X.
Captulo 7
Intervalos de Confianza y Test de
Hip
otesis
7.1.
Ejercicios Resueltos
EJERCICIO 1
Una compa
na de taxis esta tratando de decidir si compra la marca A o la marca B de
neumaticos para su flota de automoviles. Para estimar la diferencia entre las dos marcas,
se lleva a cabo un experimento con 12 neumaticos de cada marca. Los n
umeros se utilizan
hasta que se gastan. Los resultados son:
Marca Media (Km)
A
36.300
B
38.100
(a) Calcule un intervalo de confianza para 1 2 , suponiendo que las poblaciones tienen
distribucion normal con varianzas iguales.
(b) Encuentre un intervalo de confianza para 1 2 , si se asigna un neumatico de cada
compa
na en forma aleatoria a las ruedas traseras de ocho taxis y se registran, en
kilometros las siguientes distancias:
Taxi Marca A Marca B
1
34.400
36.700
2
45.500
46.800
3
36.700
37.700
4
32.000
31.100
5
48.400
47.800
6
32.800
36.400
7
38.100
38.900
8
30.100
31.500
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
106
SOLUCION
Tenemos que nA = nB = 12.
r
(XY )Sp
1
1
+
t(n +n 2,1 2 ) 1 2 (XY )+Sp
n1 n2 1 2
1
1
+
t(n +n 2,1 2 )
n1 n2 1 2
Luego necesitamos
Sp2 =
De aqu obtenemos Sp =
(121)50002 +(121)61002
12+122
684310000
22
31105000
31105000 = 5577,18.
el I.C. queda
r
(3630038100)5577,18
1
1
+
t
1 2 (3630038100)+5577,18
12 12 (22;0,975)
1
1
+
t
12 12 (22;0,975)
107
Taxi Marca A Marca B
1
34.400
36.700
2
45.500
46.800
3
36.700
37.700
4
32.000
31.100
5
48.400
47.800
6
32.800
36.400
7
38.100
38.900
8
30.100
31.500
di
-2300
-1300
-1000
900
600
-3600
-800
-1400
2
SD
Pn
=
d)2
n1
i=1 (di
luego
2
SD
=
14808750
= 2115535,71428
7
SD = 1454,488127
1454,4881
1454,4881
2,3646 1 2 111,5 +
2,3646
8
8
108
S22
F
S12 n1 1;n2 1; 2
22
12
S22
F
S12 n1 1;n2 1;1 2
61002
F
50002 11;11;0,05
22
12
61002
F
50002 11;11;0,95
61002
50002
22
12
22
12
0,3548
0,528
61002
50002
2,82
4,1973
26-30
30-34
34-38
38-42
A B
6 4
12 9
15 19
7 10
40 42
SOLUCION
Un I.C para las diferencias de proporciones esta definido por:
s
(b
pA b
pB )
Mirando en la tabla los rangos, sumamos las frecuencias de los rangos que cumplen tener
una resistencia mayor de 34 ksi, luego reemplazando pbA = 22
, pbB = 29
y Z0,975 = 1,96.
40
42
el I.C. al 95 % para pA pB es:
0,348 pA pB 0,067
Como el 0 al Intervalo, se puede decir con un 95 % de confianza que pA = pB .
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
109
EJERCICIO 3
Una firma decide estudiar una muestra aleatoria de 20 proyectos que envio para ser evaluados,
tanto a consultores externos, como a su propio departamento de proyectos. Las variables
medidas fueron
X: no de das que demoro la evaluacion.
Y : no de variables consideradas en la evaluacion.
Z: Consultor al que se le envio el proyecto
1 ; Depto. de Evaluacion
0
; Robani Consultores
Z=
1
; Tanaka Ltda.
W : Costo de la evaluacion (en U.F.)
Los resultados de este muestreo son:
No
X
Y
Z
W
1
4
3
-1
40
2
1
-1
30.5
8
6
0
80.3
4
10
8
0
68.5
1
3
0
24.7
3
2
0
40.5
8
6
1
90.6
3
2
0
38.5
2
1
0
50.4
10
2
1
1
50.2
11
4
4
-1
60.1
12
4
4
-1
60.8
13
5
4
0
70.9
14
6
7
1
80
15
7
10
1
90
16
2
3
-1
30
17
1
2
-1
27
18
3
4
0
40
19
4
5
1
50
20
9
10
-1
40
SOLUCION
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
110
Luego con
2
W
SW
SW
n
53,15 20,948 438,828 20
pq
,
n
luego con
p q n
1
1
8
2
2
tenemos que el IC(p) es:
IC(p) =
0,5 0,5
1
1,645
2
8
p (0,209; 0,790)
(c) Definamos primero:
E: Asesores externos
L: Asesores locales (internos)
Luego tenemos la siguiente tabla resumen
n
X
S
S2
E 13 59,584 21,629 467,838
L 7
41,2 14,058 197,636
Sea
E : costo medio asesores externos
L : costo medio asesores locales (internos)
Las hipotesis son
H0 : E = L
vs
H 1 : E > L
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
111
primero haremos un test de varianzas para determinar como son estas y as saber como
testamos las medias. Las hipotesis son:
H0 :
E2
=1
L2
vs
H1 :
E2
6= 1
L2
SE2
= 2,367
SL2
Y se rechaza H0 si:
F > F1 F < F2
donde F1 y F2 considerando = 0,05 son:
F1 = FnE 1;nL 1;1 2 = F12;6;0,975 = 5,37
F2 = FnE 1;nL 1; 2 = F12;6;0,025 =
1
F6;12;0,975
1
= 0,268
3,73
XE XL
q
Sp n1E + n1L
donde
Sp2 =
= 158934,925
Sp = 398,666
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
112
59,584 41,2
q
1
398,666 13
+
= 0,098
1
7
vs
H1 : pT > p R
pT pR
pT
qT
nT
pR
qT
nR
=q
0,8 0,25
0,80,2
5
= 2,335
0,250,75
8
Se rechaza H0 si Zc > Z1 .
Z1 = Z10,01 = Z0,99 = 2,325
Como Zc > Z0,99 , se rechaza H0 , por lo tanto Tanaka Ltda tiene razon.
EJERCICIO 4
La consejala de la Juventud de un Ayuntamiento maneja el dato de que la edad a la que
los hijos se independizan de sus padres es una variable aleatoria normal con media 29 a
nos.
Aunque la desviacion estandar no plantea dudas, se sospecha que la media ha aumentado,
sobre todo por el poco apoyo a la poltica de ayuda al empleo que ha llevado a cabo el
Ayuntamiento. As de un estudio reciente sobre 100 jovenes que se acaban de independizar,
se ha obtenido una media de 30.7 a
nos de edad y una desviacion estandar de 3 a
nos.
(a) Con un nivel de significancia del 1 %, es correcta la sospecha que se tiene, acerca de
la edad media en que se independizan los jovenes?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
113
(b) Se sabe que el porcentaje de personas que corresponden al sexo femenino y se independizan antes de los 29 a
nos, no supera el 45 %. Si en la muestra, 60 jovenes son mujeres,
y 35 de ellas cumplen con las caractersticas antes expuestas, Que se puede concluir
con un nivel de significancia del 5 %?.
SOLUCION
Rescatemos que n = 100, x = 30,7 y s = 3
(a) La hipotesis adecuada para esta conjetura es:
H0 : 29
H1 : < 29
Debemos hacer una prueba para la media, con 2 desconocido, ocupando el estadstico :
T =
30,7 29
x 0
=
= 5,66
s/ n
3/ 100
H0 : p 0,45
H1 : p > 0,45
p p0
Z=p
p0 (1 p0 )/n
Pero nos dicen que de 60 mujeres, 35 cumplen con que se independizan antes de los 29
35
a
nos, luego p = 60
= 0,5833.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
114
Z=p
0,5833 0,45
0,45(1 0,45)/60
= 2,07
EJERCICIO 5
En un estudio sobre habitos de alimentacion en pelcanos, se marcan 25 hembras y 11 machos,
y se les rastrea por radio. La variable de interes es la distancia (en mts.) que recorren volando
en una pasada, en busca de alimento. Se obtuvieron estos resultados:
Hembras: Distancia Media 205 mts.
Desv. Estandar 100 mts.
Machos: Distancia Media 135 mts.
Desv. Estandar 90 mts.
Puede afirmarse que el comportamiento es diferente, respecto a la distancia media recorrida?
SOLUCION
Resumiendo tenemos:
nh = 25 xh = 205 sh = 100
nm = 11 xm = 135 sm = 90
Para contestar la pregunta, debemos hacer un test de hipotesis para la diferencia de medias,
es decir:
H0 : h m = 0 H1 : h m 6= 0
Pero para esto necesitamos saber el comportamiento de las varianzas en ambas poblaciones.
Luego debemos probar si son iguales o no.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
115
H0 :
h2
=1
2
m
H1 :
h2
6= 1
2
m
s2h
< Fnh 1,nm 1, 2
s2m
1002
< F24,10,0,025 ?
902
1
donde F24,10,0,975 = 3,36 y F24,10,0,025 = F10,24,0,975
= 0,3788, luego comparando, observamos
que las desigualdades no se dan, por lo tanto no existe evidencia en los datos para rechazar
que las varianzas de ambas poblaciones son iguales.
Luego ahora docimamos nuestra hipotesis original, ya sabiendo que las varianzas poblaciones
son iguales pero desconocidas, con el estadstico :
T =
donde
s
Sp =
x xm
qh
Sp n1h + n1m
205 135
q
1
97,165 25
+
= 1,99
1
11
x xm
qh
< t,1 2
Sp n1h + n1m
116
SOLUCION
(a) Para el caso dado, tenemos el siguiente pivote:
(
x y) (1 2 )
q
tn1 +n2 2
Sp n11 + n12
donde
1 2 [0,39, 0,49]
Note que el 0 al intervalo, luego esto quiere decir que las medias se pueden considerar
iguales con un 95 % de confianza.
(b) Para el caso dado, tenemos el siguiente pivote:
S12 /12
Fn1 1,n2 1
S22 /22
Luego el intervalo queda de la forma
2 2
S2
S22
2
IC
=
Fn 1,n2 1,/2 , 2 Fn1 1,n2 1,1/2
12
S12 1
S1
Luego reemplazando se tiene
22
[0,393, 3,109]
12
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
117
Note que el 1 pertenece al intervalo, luego con un 95 % de confianza, se puede decir que las
varianzas son iguales.
(c) Para tal test de hipotesis y considerando los resultados de las letra (b), el estadstico de
prueba es
T =
x y
q
Sp n11 +
1
n2
tn1 +n2 2
El cual rechaza la hipotesis nula si T > tn1 +n2 2,1/2 o bien T < tn1 +n2 2,1/2 .
Luego reemplazando y evaluando se tiene que
T =
x y
q
Sp n11 +
1
n2
8,73 8,63
q
1
1
0,38 15
+ 18
= 0,23
Luego como T 2,039 y T 2,039, no existe evidencia presente en los datos para rechazar
H0 .
(d) El V alorp = P (Z > 0,23) = 0,492 y como este es mayor que 0.05 (), no se rechaza H0 .
EJERCICIO 7
Los siguientes datos fueron recabados en un experimento dise
nado para verificar si existe
diferencia sistematica en los pesos obtenidos con dos balanzas diferentes.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
118
Pruebe si la diferencia de las medias de los pesos obtenidos con las balanzas es significativa.
SOLUCION
En este caso lo que tenemos son muestras pareadas y lo que se pide es testear las siguientes
hipotesis
H 0 : x = y
vs H1 : x 6= y
T =
n
X
donde
2
SD
X Y
tn1
SD / n
n
X
2
(di d)
i=1
n1
, di = Xi Yi y d =
di
i=1
n
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
119
T =
X Y
SD / n
12,871 12,891
0,0286/ 10
= 2,2114
Por lo tanto, como T 2,26 = t9,0,975 y T 2,26 = t9,0,975 , no existe evidencia en los
datos para rechazar H0 .
EJERCICIO 8
De dos procesos de produccion de plastico se seleccionaron de cada 10 especmenes en forma
independiente. Las mediciones de resistencia fueron:
Plastico A 3.03 5.53 5.6 9.3 9.92 12.51 12.95 15.21 16.04 16.84
Plastico B 3.19 4.26 4.47 4.53 4.67 4.69 12.87 6.79 9.37 12.75
Utilice la teora normal para testear la hipotesis que no existe diferencia entre los procesos
de produccion.
SOLUCION
Bajo la teora de Normalidad tenemos:
H 0 : A = B
vs H1 : A 6= B
XA XB
q
tnA +nB 2
Sp n1A + n1B
el cual rechaza H0 si T > tnA +nB 2,1/2 o bien si T < tnA +nB 2,1/2 .
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
120
T =
XA XB
q
Sp n1A + n1B
10,693 6,75
p
4,25 2/10
= 2,075
SOLUCION
Bajo la teora de normalidad tenemos que las hipotesis a testear son:
H 0 : P D
vs H1 : P > D
Considerando que tenemos observaciones pareadas, es decir, dos observaciones a cada individuo (antes y despues). Por lo tanto el estadstico a utilizar es:
T =
donde d = X A X B y
2
SD
Pn
i=1 (di d)
n1
xP xD
tn1
SD / n
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
121
T =
xP xD
SD / n
188,6 168,1
18,46/ 11
= 3,68
Por lo tanto como T = 3,68 > 1,812 = t10,0,95 , se rechaza H0 , es decir, con un 95 % de
confianza la nueva droga reduce la presion.
EJERCICIO 10
Un instructor de perros esta entrenando a 27 animales para que obedezcan cierto mandato.
El instructor utiliza dos tecnicas de entrenamiento diferentes, una en la que recompensa y
alimenta (I), y otra en la que no se da recompensa alguna (II). La tabla siguiente muestra
el n
umero de sesiones de obediencia que fueron necesarias antes de que un can obedeciera
el mandato. Tiene el instructor la evidencia suficiente para aseverar que el metodo de la
recompensa requerira, en promedio, menos tiempo de entrenamiento?. Plantee las hipotesis,
llegue a conclusiones utilizando un nivel de significancia de = 0,05.
Entrenamiento I
Entrenamiento II
29 27 32
40 44 33
25
26
27
31
28 23 31
29 34 31
37
38
28
33
22
42
24 28 31
35
34
SOLUCION
Tenemos que son dos muestras independientes, y por simplicidad asumiremos que las varianzas poblacionales de cada una de las muestras son iguales. Luego las hipotesis quedan:
H0 : I II
vs H1 : I < II
T =
2
(n 1)S 2 +(n 1)SII
I
II
I
donde Sp =
nI +nII 2
en este caso tenemos
X I X II
q
tnI +nII 2
Sp n1I + n1II
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
122
T =
X I X II
q
Sp n1I + n1II
28,4 34,7
= q
1
1
5 15
+ 12
= 3,25
Por lo tanto como T = 3,25 < 1,7 = t25,0,05 se rechaza H0 , es decir, el instructor tiene
evidencia para aseverar que el metodo de la recompensa, requiere menos sesiones de entrenamiento.
EJERCICIO 11
En un proceso de ba
no qumico utilizado para grabar tarjetas de circuito impreso, se estan
comparando dos diferentes catalizadores para determinar si requieren diferentes tiempos de
inmersion para remover cantidades identicas de material fotorresistente. Se efectuaron 12
ba
nos con el catalizador 1, resultando un tiempo de inmersion medio de x1 = 24,6 min. y
una desviacion estandar de s1 = 0,85 min.. Con el catalizador 2 se efectuaron 15 ba
nos, siendo el tiempo de inmersion medio de x2 = 22,1 min. y una desviacion estandar de s2 = 0,98
min. Se desea determinar si hay diferencia significativa en los tiempos de inmersion al utilizar
un catalizador en especial. Para responder esto construya un intervalo de confianza al 95 %
de confianza. Considere que no se conoce el comportamiento de las varianzas poblacionales.
SOLUCION
Primero se debe concluir el comportamiento de las varianzas para decidir que tipo de intervalo hacer. Para ello se construira un intervalo de confianza para el cuociente de varianzas
al 95 % de confianza.
s22
22
s22
F
F11,14,0,975
11,14,0,025
s21
12
s21
0,982
12
0,982
0,2977 2
3,094
0,852
2
0,852
12
4,112
22
Luego con un 95 % de confianza, puesto que el intervalo incluye la unidad, podramos no requerir que las varianzas de los tiempos de inmersion para los dos catalizadores sean diferentes.
0,395
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
123
Luego debemos hacer un intervalo de confianza para diferencia de medias, con varianzas
desconocidas pero iguales. Usando Minitab:
N
12
15
Mean
24,600
22,100
StDev
0,850
0,980
SE Mean
0,25
0,25
P-Value = 0,000
DF = 25
De aqu concluimos con 95 % de confianza que el catalizador 1 requiere un tiempo de inmersion, que esta entre 1.76 min. y 3.24 min., mas largo que el requerido por el catalizador 2.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
124
7.2.
Ejercicios Propuestos
1. Un fabricante produce anillos para los pistones de un motor de automovil. Se sabe que
el diametro del anillo esta distribuido aproximadamente de manera normal, y que tiene
una desviacion estandar = 0,001 mm. Una muestra aleatoria de 15 anillos tiene un
diametro promedio de X = 74,036 mm.
a) Construya un IC bilateral del 99 % para el diametro promedio del anillo.
b) Construya un lmite inferior de confianza del 95 % para el diametro promedio del
anillo.
2. Se utilizan dos maquinas para llenar botellas de plastico con detergente para maquinas
lavaplatos. Se sabe que las desviaciones estandar del volumen de llenado son 1 = 0,10
onzas de lquido y 2 = 0,15 onzas de lquido para las dos maquinas, respectivamente.
Se toman dos muestras aleatorias, n1 = 12 botellas de la maquina 1 y n2 = 10 botellas
de la maquina 2. Los vol
umenes promedio de llenado son x1 = 30,87 onzas de lquido
y x2 = 30,68 onzas de lquido.
a) Construya un IC bilateral del 90 % para la diferencia entre las medias del volumen
de llenado.
b) Construya un IC bilateral del 95 % para la diferencia entre las medias del volumen
de llenado. Compare el ancho de este intervalo con el ancho del calculo en el inciso
a).
c) Construya un IC superior del 95 % para la diferencia de medias del volumen del
llenado.
3. Se prueban dos formulas diferentes de un combustible oxigenado para motor en cuanto
al octanaje. La varianza del octanaje para la formula 1 es 12 = 1,5, mientras que para
la formula 2 es 22 = 1,2. Se prueban dos muestras aleatorias del tama
no n1 = 15 y
n2 = 20. Los octanajes promedios observados son x1 = 89,6 y x2 = 92,5. Construya un
IC bilateral del 95 % para la diferencia en el octanaje promedio.
4. Considere la situacion sobre pruebas de octanaje descrita en el ejercicio anterior.
Que tama
no de muestra se requiere para cada poblacion si se desea tener una confianza del 95 % de que el error al estimar la diferencia entre las medias de octanaje sea
menor que 1?
5. Se piensa que la concentracion del ingrediente activo de un detergente lquido para
ropa, es afectada por el tipo de catalizador utilizado en el proceso de fabricacion. Se
sabe que la desviacion estandar de la concentracion activa es de 3g/l sin importar el
tipo de catalizador utilizado. Se realizan diez observaciones con cada catalizador, y se
obtiene los datos siguientes:
Catalizador1 : 57,9 66,2 65,4 65,4 65,2 62,6 67,6 63,7 67,2 71,0
Catalizador2 : 66,4 71,7 70,3 69,3 64,8 69,6 68,6 69,4 65,3 68,8
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
125
126
86,90
87,13
86,91
86,92
86,83
86,94
86,92
87,03
87,16
87,19
87,11
87,04
86,91
87,08
86,81
86,80
86,92
87,05
87,13
86,98
87,02
87,13
86,95
86,84
86,97
13. Supongase que conocemos que un saco podra contener 1 bola roja y 4 bolas blancas o,
alternativamente, 4 bolas rojas y 1 blanca. Una bola es extrada, y la hipotesis que una
bola es roja y 4 bolas son blancas puede ser no rechazada si y solo s la bola extrada
es blanca.
(a) Encontrar y
(b) Cuales son los valores de y si la alternativa es 3 bolas rojas y 2 bolas blancas
14. Supongase que sabemos que un saco podra contener 2 bolas rojas y 3 blancas (la
hipotesis a ser testeada) o 3 bolas rojas y 2 blancas (la alternativa). Dos bolas son
extradas sin reemplazo, y la hipotesis es rechazada si y solo si ambas bolas extradas
son rojas. Hallar y
15. Una caja contiene 10 bolas, y queremos testear la hipotesis que 2 bolas son rojas y 8
son blancas frente a la alternativa que mas de 2 bolas son rojas. Extraemos 2 bolas
sin reemplazo y rechazamos la hipotesis si y solo si ambas bolas extradas son rojas. a)
Hallar a b) Hallar b(q) y graficar la funcion potencia
(a) Hallar
(b) Hallar () y graficar la funcion potencia
16. Si una moneda es tirada 5 veces y sale 5 veces cara, podemos concluir que la moneda
no es honesta?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
127
17. Considere el siguiente caso no matematico como una prueba de hipotesis. En la escena
de un accidente grave, un medico contrasta la hipotesis nula esta vctima esta viva.
(a) Establezca cuidadosamente el significado de los cuatro resultados posibles indicados en la tabla 1.
(b) Decida sobre la gravedad de los errores posibles.
(c) Si y pudiesen ser controlados estadsticamente, que conjunto de probabilidades seran preferibles para la vctima?
I. =0.001 y =0.10
II. =0.05 y =0.05
III. =0.10 y =0.001
Tabla 1
Hipotesis Nula
Decision
Verdadera
Falsa
No se rechaza Ho Decision correcta Error tipo II
Se rechaza Ho
Error tipo I
Decision correcta
18. Un fabricante de fibras textiles esta investigando una nueva fibra para tapicera, la cual
tiene una elongacion media por hilo de 12 kg. con una desviacion estandar de 0.5 kg.
La compa
na desea probar la hipotesis H0 : < 12, utilizando para ello una muestra
aleatoria de 4 especmenes.
19. Un consumidor de cierto producto acusa al fabricante diciendo que mas del 20 % de
las unidades producidas eran defectuosas. Para confirmar su acusacion se utilizo una
muestra de tama
no 50 donde el 27 % de los artculos eran defectuosos Que concluye
usted?
20. Una fabrica de hamburguesas inicio un proceso de revision de los estandares de calidad
de sus productos. Dichos estandares establecen ciertas dimensiones para el diametro
de sus hamburguesas, el diametro medio es de 13.9 cm con una desviacion estandar
estimada de 0.9 cm. Un estandar de calidad establece que el diametro medio de las
hamburguesas debe ser de 14.5 cm. Hay alguna evidencia en los datos que las hamburguesas tienen un diametro incorrecto? Que supuesto utilizo?
21. Se utilizan dos maquinas para llenar botellas de plastico con un volumen neto de
16.0 onzas. Las distribuciones de los vol
umenes de llenado pueden suponerse normales,
con desviaciones estandar 1 = 0,020 y 2 = 0,025 onzas. Un miembro del grupo de
ingeniera de calidad sospecha que el volumen neto de llenado de ambas maquinas es el
mismo, sin importar si este es o no de 16 onzas. De cada maquina se toma una muestra
aleatoria de 10 botellas.
Maquina 1: 16,03 16,04 16,05 16,05 16,02 16,01 15,96 15,98 16,02 15,99
Maquina 2: 16,02 15,97 15,96 16,01 15,99 16,03 16,04 16,02 16,01 16,00
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
128
Media Varianza
12
35.71
10
36.43
Metodo
Tradicional Nuevo
9
9
35
31
25
20
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
129
Hay suficiente evidencia que indique que las medias de los tiempos reales son diferentes
con los dos metodos? Realice una prueba con el nivel = 5 %. Determine el valor-p de
la prueba. (sea explcito, de hipotesis, test y conclusion).
25. El contenido de nicotina de dos marcas de cigarros, medidas en miligramos, es la
siguiente:
A
B
512 794
982 2346
Utilice la teora normal para testear la hipotesis de que existe diferencia entre los dos
tipos de produccion.
27. Para la elaboracion de un neumatico se utilizan dos metodos. A dichos neumaticos se
les mide el desgaste. Se seleccionan 12 neumaticos de cada tipo y siendo sus mediciones
de desgaste, las siguientes:
Proceso 1 329 436 457 463 477 479 1297 1319 1340 1385 1398 1440
Proceso 2 313 563 670 940 1002 1261 1305 1531 1614 1694 1701 1708
Utilice la teora de normalidad para testear la hipotesis de que no existe diferencia
entre los metodos de elaboracion.
28. Se efect
ua una prueba de impacto Izod sobre 20 muestras de tubera PVC. El estandar
ASTM para este material requiere que la resistencia al impacto Izod sea mayor que
1.0 ft-lb/in. El promedio y la desviacion estandar muestrales son x = 1,25 y s = 0,25,
respectivamente. Pruebe H0 : = 1,0 contra H1 : > 1,0 utilizando = 0,01. Obtenga
conclusiones.
29. En la fabricacion de semiconductores, a menudo se utiliza una sustancia qumica para
quitar el silicio de la parte trasera de las obleas antes de la metalizacion. En este
proceso es importante la rapidez con la que act
ua la sustancia. Se han comparado dos
soluciones qumicas, utilizando para ello dos muestras aleatorias de 10 obleas para cada
solucion. La rapidez de accion observada es la siguiente (en mils/min):
Solucion 1: 9,9 9,4 9,3 9,6 10,2 10,6 10,3 10,0 10,3 10,1
Solucion 2: 10,2 10,6 10,7 10,4 10,5 10,0 10,2 10,7 10,4 10,3
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
130
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
Captulo 8
Test de Homogeneidad,
Independencia y Bondad de Ajuste
8.1.
Ejercicios Resueltos
EJERCICIO 1
Un ginecologo analiza la posible relacion entre la edad de la menarqua y la aparicion de
cancer de mama. Con el fin de estudiarlo clasifica a las mujeres que acuden a su consulta en
dos grupos, aquellas que tuvieron la menarqua antes de los 12 a
nos (a las que distingue con
el valor cero), y aquellas que la tuvieron despues de esta edad ( a las que distingue con el
valor 1). Se presentan a continuacion los resultados obtenidos:
Cancer de
Edad de la Menarqua
S
0
64
47
1
Mama
No
53
139
SOLUCION
Para medir si existe relacion entre la edad de la menarquia y el cancer de mama, realizamos
un test de independencia.
H0 : n i j =
ni nj
n
H1 : no existe independencia
X (obs esp)2
i,j
esp
en donde los observados son los valores que aparecen en la tabla y los esperados los calculamos mediante H0 , por ejemplo, el esperado para la casilla
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
132
n11 =
117 111
n1 n1
=
= 42,8613
n
303
Luego para cada casilla, los esperados seran los que se muestran a continuacion:
Cancer
Si
No
64
53
42,86
74,14
0
Edad
1
Total
117
47
68,14
139
117,86
186
111
192
303
Total
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
133
SOLUCION
En este caso debemos hacer un test de Bondad de Ajuste, para una distribucion exponencial
de los datos.
Para esto debemos sacar las frecuencias esperadas para cada uno de los rangos, bajo la
hipotesis de una distribucion exponencial, luego primero debemos estimar el parametro de
la exponencial.
Sabemos que la E(X) = 1 cuando X Exp(), luego ocupemos el estimador de la media:
P
x =
M C fi
1
P
= 0,4865 =
fi
1
= 2,055
0,4865
Posteriormente, calculamos las probabilidades de estar en cada uno de las clases de la tabla
de frecuencias, para despues calcular la frecuencia esperada.
0,2
2,055e2,055x dx = 0,337
2,055e2,055x dx = 0,2234
2,055e2,055x dx = 0,1481
2,055e2,055x dx = 0,0982
2,055e2,055x dx =
0,0651
0,8
Z
P (1,0 < X < 1,1) =
1,1
2,055e2,055x dx = 0,0237
Como tenemos un total de 100 observaciones, las frecuencias esperadas las obtenemos multiplicando la probabilidad de estar en la clase por 100, es decir:
fesperada [0 0,2] = P (0 < X < 0,2) 100 = 33,7
Luego haciendo el calculo para cada celda, queda:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
134
X (obsi espi )2
i
espi
(29 33,7)2 (20 22,34)2 (15 14,81)2 (9 9,82)2 (12 6,51)2 (15 2,37)2
+
+
+
+
+
33,7
22,34
14,81
9,82
6,51
2,37
= 72,9
umero de clases y p
Luego rechazamos H0 si 2 > 21,kp1 = 20,95,611 = 9,48 con k el n
el n
umero de parametros de la distribucion.
Por lo tanto, como 72,9 > 9,48 se rechaza la postura de una distribucion exponencial en los
datos del tiempo de vida de las ampolletas.
EJERCICIO 3
Un mecanico analiza la posible relacion entre la edad de la maquina y la aparicion de una
falla grave. Con el fin de estudiarlo clasifica a las maquinas en dos grupos, aquellas que
tuvieron una falla grave antes de los 12 a
nos (a las que distingue con el valor 0), y aquellas
que la tuvieron despues de esta edad (a las que distingue con el valor 1). Se presentan a
continuacion los resultados obtenidos:
Falla
Si
Edad Maquina 0 64
1 47
Grave
No
53
139
SOLUCION
Completamos la tabla dada con los valores esperados
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
135
Falla Grave
Si
No
0
64
53
42,861 74,139
Total
117
Edad Maquina
1
Total
47
68,139
139
117,861
186
111
192
303
(a) Dada la tabla completa con los los valores esperados calculamos el estadstico como
sigue:
r X
c
X
(Oij Eij )2
=
Eij
i=1 j=1
2
2 X
2
X
(Oij Eij )2
=
Eij
i=1 j=1
0
1
82 185
2
182
3
110
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
4
66
136
SOLUCION
Necesitamos calcular las frecuencia esperadas, mediante las probabilidades.
P (X = 0) =
1 20
7 0!
= 0,1428
P (X = 1) =
1 21
7 1!
= 0,2857
P (X = 2) =
1 22
7 2!
= 0,2857
P (X = 3) =
1 23
7 3!
= 0,1904
P (X = 4) =
1 24
7 3!
= 0,0952
luego el n
umero de casos esperados sera
Ei = P (X = i) 625 = no de defectos igual a i
una vez calculados estos valores tenemos lo siguiente
# de defectos (i)
0
1
2
3
4
# de casos observado (Oi )
82
185
182
110 66
# de casos esperados (Ei ) 89.25 178.56 178.56 119 59.5
Para la hipotesis H0 : los datos distribuyen con la funcion de probabilidad dada.
Se rechaza H0 si
2 =
5
X
(Oi Ei )2
i=1
Ei
> 21;kp1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
137
EJERCICIO 5
Una empresa empaca determinado producto de latas de tres tama
nos distintos, cada uno en
distinta lnea de produccion. La mayor parte de las latas se apegan a las especificaciones,
pero un ingeniero de control de calidad ha identificado los siguientes defectos:
Mancha en la lata.
Grieta en la lata.
Ubicacion incorrecta del anillo de apertura.
Falta del anillo de apertura.
Otras.
Se selecciona una muestra de unidades defectuosas de cada una de las tres lneas, y cada
unidad se clasifica seg
un el defecto, la siguiente tabla de contingencia incluye esos datos:
Defecto
Mancha Grieta Ubicacion
Lnea
1
34
65
17
de
2
23
52
25
Produccion
3
32
28
16
Total
89
145
58
Falta
21
19
14
54
Otras
13
6
10
29
Tama
no de la muestra
150
125
100
375
Los datos sugieren desigualdad en las proporciones que caen en las distintas categoras de
las tres lneas?
SOLUCION
Los parametros de interes son las diversas proporciones y las hipotesis relevantes son:
H0 : Las lneas de produccion son homogeneas con respecto a las 5 categoras que no cumplen
las especificaciones.
H1 : Las lneas de produccion no son homogeneas con respecto a las 5 categoras que no
cumplen las especificaciones.
Ahora se presenta una tabla resumen con los valores esperados y el valor de (Obs.
Esp.)2 /Esp.
1
C1
34
35,60
0,072
C2
65
58,00
0,845
C3
17
23,20
1,657
C4
21
21,60
0,017
C5
13
11,60
0,169
Total
150
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
138
23
29,67
1,498
52
48,33
0,278
25
19,33
1,661
19
18,00
0,056
6
9,67
1,391
125
32
23,73
2,879
28
38,67
2,943
16
15,47
0,018
14
14,40
0,011
10
7,73
0,664
100
Total
89
145
58
54
29
375
Neutral
15
73
86
174
No agresiva ni.
17
56
80
205
36
180
133
441
En el nivel 0.01, la informacion sugiere que las condiciones de instalaciones y las polticas
de precios son independientes entre si?
SOLUCION
La hipotesis a docimar es:
H0 : Las condiciones de las instalaciones con la poltica de precios son independientes.
vs
H1 : No existe independencia.
La siguiente tabla resumen entrega la informacion necesaria para calcular el estadstico 2 .
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
C2
15
22,10
2,278
C3
17
16,89
0,001
Total
56
52
62,29
1,700
73
80,88
0,769
80
61,83
5,343
205
58
54,69
0,200
86
71,02
3,159
36
54,29
6,159
180
Total
134
174
133
441
139
Subcompacto
Tama
no de Compacto
Automovil Mediano
Grande
Distancia de Recorrido
[0, 10) [10, 20) [20, . . .)
6
27
19
8
36
17
21
45
33
14
18
6
SOLUCION
La hipotesis a docimar es:
H0 : Existe independencia entre la distancia de recorrido y el tama
no del automovil.
vs
H1 : No existe independencia.
La siguiente tabla resumen entrega la informacion necesaria para calcular el estadstico 2 .
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
140
C2
27
26,21
0,024
C3
19
15,60
0,741
Total
52
8
11,96
1,309
36
30,74
0,899
17
18,30
0,092
61
21
19,40
0,131
45
49,90
0,480
33
29,70
0,367
99
14
7,45
5,764
18
19,15
0,069
6
11,40
2,558
38
Total
49
126
75
250
Mujer
14
10
Alguien acusa al empleador de tener un sesgo de seleccion a favor de los hombres ya que 21 de
24 hombres fueron contratados y solo 14 de 24 mujeres tambien lo fueron. Existira discriminacion por parte del jefe de personal?. Plantee las hipotesis con palabras y parametricamente,
llegue a conclusiones utilizando un nivel de significancia de = 0,05.
SOLUCION
Hipotesis:
H0 : No existe discriminacion (Homogeneidad)
vs
H1 : Existe discriminacion (No Homogeneidad)
Equivalentemente
H0 : p1j = p2j j = 1, 2 vs H1 : p1j 6= p2j para alg
un j
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
141
donde eij =
ni nj
,
n
2 =
Como 2 = 5,1692 > 3,84 = 20,95,1 , se rechaza H0 , es decir, con un 95 % de confianza existe
discriminacion hacia la mujer por parte del jefe de personal.
EJERCICIO 9
De cada una de tres comunidades se saco una muestra de jovenes casados. A cada pareja se le
pidio que especificara la cantidad mnima de educacion que esperaba que sus hijos recibieran.
La siguiente tabla muestra los resultados que se observaron en la muestra:
Nivel Mnimo
Colegio
Educ. comercial
Universitario
Total
Comunidad
A
B
C Total
30 28 24
82
30 19 46
95
90 78 130 298
150 125 200 475
SOLUCION
Las hipotesis son:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
142
donde eij =
ni nj
,
n
Nivel Mnimo
Colegio
Educ. comercial
Universitario
Total
Comunidad
A
B
C
25.89 21.58 34.53
30.00 25.00 40.00
94.11 78.42 125.5
150
125
200
Total
82
95
298
475
2 =
(30 25,89)2 (28 21,58)2 (24 34,53)2 (30 30)2 (19 25)2 (46 40)2
+
+
+
+
+
25,89
21,58
34,53
30
25
40
(90 94,11)2 (78 78,42)2 (130 125,5)2
+
+
94,11
78,42
125,5
= 8,455
Como 2 = 8,455 < 9,488 = 20,95,4 , no existe evidencia en los datos para rechazar H0 , es
decir, con un 95 % de confianza existe homogeneidad entre las comunidades.
EJERCICIO 10
Se selecciono una muestra al azar de 275 alumnos de u
ltimo a
no de colegio de cada uno
de los siguientes tres grupos de rendimiento atletico: alto, medio y bajo. Los muchachos se
clasificaron de acuerdo con la inteligencia tal como aparece en la tabla. Indican estos datos
una diferencia en la distribucion de la inteligencia entre los tres grupos?
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
143
Rendimiento
Inteligencia Alto Medio Bajo
Alta
45
60
68
Media
10
15
25
Baja
5
15
32
Total
60
90
125
Total
173
50
52
100
SOLUCION
Las hipotesis son:
H0 : Los 3 niveles de inteligencia son homogeneos respecto del rendimiento. (p1j = p2j = p3j ).
H1 : Los 3 niveles de inteligencia no son homogeneos respecto del rendimiento (Por lo menos
2 proporciones de una misma columna no son iguales entre si.)
Para testear tales hipotesis, se ocupa el estadstico
2 =
donde eij =
ni nj
,
n
I X
J
X
(oij eij )2
eij
i=1 j=1
2 =
(45 37,77)2 (60 56,62)2 (68 78,64)2 (10 10,91)2 (15 16,36)2 (25 36,36)2
+
+
+
+
+
37,77
56,62
78,64
10,91
16,36
36,36
(5 11,35)2 (15 17,02)2 (32 23,64)2
+
+
11,5
17,02
23,64
= 10,199
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
144
SOLUCION
Las hipotesis son:
H0 : Existe independencia entre el grado de liberalismo y el a
no universitario. (nij =
ni nj
).
nij
ni nj
).
nij
donde eij =
ni nj
,
n
I X
J
X
(oij eij )2
eij
i=1 j=1
145
2 =
(30 22,5)2 (83 66,9)2 (37 60,6)2 (19 18,75)2 (56 55,75)2 (50 50,5)2
+
+
+
+
+
22,5
66,9
60,6
18,75
55,75
50,5
(16 18,75)2 (46 55,75)2 (63 50,5)2 (10 15)2 (38 44,6)2 (52 40,4)2
+
+
+
+
+
18,75
55,75
50,5
15
44,6
40,4
= 26,751
Filiacion
Democrata
Republicano
Total
SOLUCION
Las hipotesis son:
H0 : Existe independencia entre la tendencia poltica y la actitud hacia la reforma. (nij =
ni nj
).
nij
H1 : Existe asociacion entre la tendencia poltica y la actitud hacia la reforma.(nij 6=
Para testear tales hipotesis, se ocupa el estadstico
2 =
I X
J
X
(oij eij )2
eij
i=1 j=1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
ni nj
).
nij
146
ni nj
,
n
Filiacion
Democrata
Republicano
Total
2 =
(138 115,14)2 (83 85,5)2 (64 84,36)2 (64 86,86)2 (67 64,5)2 (84 63,64)2
+
+
+
+
+
115,14
85,5
84,36
86,86
64,5
63,64
= 22,51
Promedio notas
4,0
> 4,0
Total
Ha consumido Drogas?
Si
No
Total
10
29
39
20
41
61
30
70
100
SOLUCION
Las hipotesis son:
H0 : Existe independencia entre el consumo de drogas y el promedio de notas (nij =
H1 : Existe asociacion entre el consumo de drogas y el promedio de notas.(nij 6=
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
ni nj
).
nij
ni nj
).
nij
147
ni nj
,
n
I X
J
X
(oij eij )2
eij
i=1 j=1
2 =
= 0,578
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
148
8.2.
Ejercicios Propuestos
1. (a) Se observo la duracion en horas de 100 pilas de una determinada marca, obteniendose
los siguientes resultados:
< 20 20 40 40 60 60 80 80
Horas
Frecuencia
5
26
34
22
13
Hay evidencia suficiente para rechazar la hipotesis de que los datos siguen una
distribucion normal de parametros = 50 y = 20?
(b) Las ampolletas pueden clasificarse seg
un su potencia (watts) y se piensa que de
alguna forma existe una relacion entre la duracion y la potencia. Para verificar lo
anterior se tabulan los datos, obteniendose lo siguiente:
Duracion superior
a 200 horas
Si
No
Potencia < 100W 30
20
100W 20
30
2. (a) El n
umero de accidentes sufridos por operadores de maquina de herramientas
en determinada industria se registro durante cierto periodo con los resultados
siguientes:
Accidentes por Operador 0
1 2 3 4 5 6 7 8
N
umero de Operadores
296 74 26 8 4 4 1 0 1
Con el nivel de significancia del 5 %, probar la hipotesis de que los datos provienen
de una distribucion Poisson.
(b) Una muestra aleatoria de 200 hombres casados, todos retirados, se clasifico de
acuerdo a la educacion y el n
umero de hijos de cada uno de ellos:
Cantidad de hijos
0 1 2 3 mas de 3
Primaria
14
37
32
Educacion Secundaria
19
42
17
Bachillerato
12
17
10
Pruebe la hipotesis, con un nivel de significancia del 5 %, que el tama
no de una
familia es independiente del nivel de educacion del padre.
3. Cada uno de 325 individuos que participan en cierto programa de medicamentos, se
clasifico con respecto a la presencia o ausencia de hipoglucemia y con respecto a la dosis
media diaria de insulina. Apoyan los datos siguientes lo dicho de que la presencia o
ausencia de hipoglucemia es independiente de las dosis de insulina? Pruebe usando
= 0,05.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
149
Condicion de Presente
Hipoglucemia Ausente
1
2
Genotipo 3
Masculino 4
5
6
Combinacion de sexo
M/M M/F F/F
35
80
39
41
84
45
33
87
31
8
26
8
5
11
6
30
65
20
5. Una muestra aleatoria de 200 hombres casados, todos retirados, se clasifico de acuerdo
a la educacion y el n
umero de hijos de cada uno de ellos:
Cantidad de hijos
0 1 2 3 mas de 3
Primaria
14
37
32
Educacion Secundaria
19
42
17
Bachillerato
12
17
10
Pruebe la hipotesis, con un nivel de significancia del 5 %, que el tama
no de una familia
es independiente del nivel de educacion del padre.
6. Una compa
na opera cuatro maquinas, tres turnos al da. De los registros de produccion,
se obtuvieron los siguientes datos sobre el n
umero de fallas:
Turno
1
2
3
A
41
31
15
Maquinas
B
C
20
12
11
9
17
16
D
16
14
10
150
Moderna
58
86
36
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
Captulo 9
An
alisis de Regresi
on
9.1.
Ejercicios Resueltos
EJERCICIO 1
Suponga que se tiene interes en ajustar un modelo de regresion lineal simple
Yi = 0 + 1 xi + i ,
i = 1, ..., n
donde
i N (0, 2 )
y 0 y 2 son conocidos.
(a) Encuentre el estimador de mnimos cuadrados de 1 .
(b) Cual es la varianza del estimador encontrado en el inciso (a)?
(c) Encuentre una expresion para el intervalo de confianza del 100(1 ) % para la pendiente 1 . Este intervalo es mayor que el intervalo correspondiente al caso donde tanto
0 como 1 son desconocidos?
SOLUCION
(a) Estimador de mnimos cuadrados para 1
n
X
2i =
i=1
n
X
(yi o 1 xi )2
i=1
n
X
i=1
2i
= 2
n
X
(yi 0 1 xi ) xi = 0
i=1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
152
Captulo 9. An
alisis de Regresi
on
n
X
(yi 0 1 xi ) xi = 0
i=1
n
X
(xi yi 0 xi 1 x2i ) = 0
i=1
n
X
xi yi 0
n
X
xi 1
i=1
i=1
n
X
x2i = 0
i=1
1 =
xi yi 0
n
X
i=1
xi
i=1
n
X
x2i
i=1
n
X
xi yi 0
i=1
V ar(1 ) = V ar
n
x2i
n
X
i=1
xi
i=1
1
n
X
!2 V ar
x2i
n
X
xi yi 0
i=1
i=1
i=1
1
n
X
!2 V ar
x2i
n
X
!
xi yi
i=1
i=1
ind
n
X
1
n
X
!2
x2i
n
X
x2i V ar(yi )
i=1
i=1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
!
xi
153
n
X
1
n
X
!2
x2i
x2i 2
i=1
i=1
n
X
= 2
x2i
i=1
n
X
!2
x2i
i=1
2
n
X
x2i
i=1
1 1 t(n2),1 2 s.e(1 )
donde
v
u 2
u
s.e(1 ) = u n
uX
t
x2
i
i=1
considerando 2 conocido.
EJERCICIO 2
Suponga que se especifica un modelo lineal simple sin intercepto
yi = xi + i ,
i = 1, . . . , n
i N (0, 2 )
(a) Encuentre el estimador de mnimos cuadrados de ,
y de 2 ,
2.
(b) Calcule E(
) y V ar(
).
(c) Estime la ecuacion de regresion a partir del siguiente conjunto de datos
x 2 2 3 4 4
y 5 6 9 11 13
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
154
Captulo 9. An
alisis de Regresi
on
SOLUCION
(a) Estimador de mnimos cuadrados para
n
X
2i
n
X
i=1
(yi xi )2
i=1
n
X
i=1
2i
= 2
n
X
(yi xi ) xi = 0
i=1
n
X
(yi xi ) xi = 0
i=1
n
X
(xi yi x2i ) = 0
i=1
n
X
xi yi
i=1
n
X
i=1
xi yi
i=1
n
X
x2i
i=1
2 =
SSE
n2
n
X
2i
i=1
n2
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
x2i = 0
155
n
X
i=1
n2
n
X
(yi
xi )2
yi2
i=1
n
X
xi yi +
n
X
x2i
i=1
i=1
n2
n
X
2
yi2
i=1
!2
n
X
n
X
xi yi
i=1
n
X
!2
xi yi
i=1
n
X
x2i
i=1
i=1
n2
n
X
n
X
yi2
i=1
xi yi
i=1
n
X
x2i
i=1
n2
n
X
!2
n
X
yi2
i=1
n2
!2
xi yi
i=1
(n 2)
n
X
!
x2i
i=1
(b)
1
E(
) = n
X
E
x2i
n
X
!
xi yi
i=1
i=1
1
= n
X
n
X
xi E (yi )
x2i i=1
i=1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
,
n
X
x2i
i=1
!2
x2i
156
Captulo 9. An
alisis de Regresi
on
1
n
X
n
X
x2i
xi xi
i=1
i=1
,
n
X
1
= n,
x2i
X
i=1
x2i
i=1
=
es un estimador insesgado.
(c) Para estimar la recta debemos solo calcular
en base a los datos
n
X
xi yi
i=1
n
X
=
x2i
10 + 12 + 27 + 44 + 52
= 2,959
4 + 4 + 9 + 16 + 16
i=1
4.0
0.12
157
SOLUCION
(a) Observando el grafico de dispersion siguiente se sugiere que hay una asociacion lineal
entre el % de absorcion de luz y el pico de fotovoltaje
Sxy
1 =
Sxx
x = 19,96667
Sxx =
9
X
(xi x)2
= 746,4
(yi y)2
= 1,514089
i=1
Syy =
9
X
i=1
Sxy =
9
X
i=1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
158
Captulo 9. An
alisis de Regresi
on
luego, reemplazando tenemos que
0 = 0,08259353
1 = 0,04464854
SSE
SSR
=1
Syy
Syy
donde
R2 = 1
0,02614669
1,514089
= 0,9827311
98,27 %
Luego, el modelo explica el 98.27 % de variabilidad presente en los datos, lo que se
considera muy bueno.
(d) El pronostico cuando el % de absorcion es de 19.1 es
159
x
y
y
19,1 0,68 0,7701936
luego el residuo es
e = 0,68 0,7701936 = 0,0901936
(e) Dado que se pide una verificacion para la regresion lineal, tenemos que probar si el
coeficiente 1 es significativo, es decir distinto de cero.
La hipotesis a docimar es la siguiente:
H0 : 1 = 0
H1 : 1 6= 0
vs
El estadstico de prueba es
tc =
1 0
s.e(1 )
2
Sxx
2 =
SSE
n2
0,02614669
7
= 0,003735241
luego el estadstico Tc queda
Tc =
0,04464854 0
q
= 19,95877
0,003735241
746,4
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
160
Captulo 9. An
alisis de Regresi
on
Existe suficiente evidencia para rechazar H0 con un 95 % de confianza, es decir, hay
una relacion lineal u
til entre el % de absorcion de luz y el pico de fotovoltaje.
EJERCICIO 4
En el cultivo de tejidos in vitro se ha observado que si se colocan dos n
ucleos, a esto se
llama un campo de atraccion, los campos de atraccion se forman con mayor frecuencia si los
n
ucleos estan cercanos. En un experimento se colocaron 20 n
ucleos a distancias diferentes
y se midio la incidencia de campos de atraccion (Y ) para las diferencias distancias (X).
Lamentablemente se borro parte del analisis de regresion y se le solicita completarlo.
(a) Completa la tabla ANOVA que se entrega a continuacion:
Tabla ANOVA
Fuente
g.l
SS
MS
Regresion
1 2.0559
Error
Total
F
301.08
(b) Que porcentaje de la variable total esta siendo explicada por el modelo?
(c) Utilizando la siguiente informacion realice test de hipotesis para los parametros del
modelo. Concluya.
Ecuaci{\o}n de regresi{\o}n Y = 1.18 - 0.278 X
Predictor Coef
Stdev
t-ratio
Const
1.176232 0.03839 30.64
Distancia -0.278010 0.01602 -17.35
SOLUCION
Fuente
Regresion
Error
Total
Tabla ANOVA
g.l
SS
MS
F
p
SSR
SSR /p
M SR /M SE
n 1 p SSE SSE /(n 1 p)
n1
SST
161
Fuente
Regresion
Error
Total
Tabla ANOVA
g.l
SS
MS
F
1 2.0559 301.08 0.1229
18 0.1229 0.0068
19 2.1788
SSE
SSR
=1
Syy
Syy
R2 = 1
0,1229
2,1788
= 0,9435928
94,36 %
luego, el modelo explica el 94.36 % de variabilidad presente en los datos.
(c) Mediante el test T docimaremos las siguientes hipotesis:
Ho : 0 = 0
vs
H1 : 0 6= 0
Ho : 1 = 0
vs
H1 : 1 6= 0
y
donde la region de rechazo para este caso esta definida por
R : |Tc | > tn2;1 2
Como t7,0,975 = 2,365 tenemos que |T0 | = 30,64 > t7,0,975 y |T1 | = 17,35 > t7,0,975 , en
ambos casos se rechaza H0 con un 95 %, es decir, los parametros son significativos.
EJERCICIO 5
Se ha comprobado que las aleaciones amorfas tienen una excelente resistencia a la corrosion.
En Corrosion Science(Septiembre de 1993) se informo de la resistividad de una aleacion
amorfa de hierro, boro y silicio despues de la cristalizacion. Se reconocieron cinco especmenes
de la aleacion a 700o C, cada uno durante un intervalo de tiempo distinto. Despues se midio el
potencial de pasivacion -una medida de la resistividad de la aleacion cristalizada- para cada
especmenes. Los datos experimentales son los siguientes:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
162
Captulo 9. An
alisis de Regresi
on
Tiempo de Recorrido Potencial de Pasivacion
(minutos)
(m V)
y
x
10
-408
-400
20
45
-392
-379
90
120
-385
(a) Construya un diagrama de dispersion para los datos.
(b) Suponiendo que la mejor forma de describir la relacion entre las variables es con una
lnea recta, utilice el metodo de mnimos cuadrados para estimar la ordenada al origen
y la pendiente de la lnea recta. Interprete estos valores.
(c) Trace la lnea de mnimos cuadrados sobre el diagrama de dispersion.
(d) Seg
un la lnea de mnimos cuadrados. Cual es el potencial de pasivacion esperado y,
cuando el tiempo de recocido es de x = 30 minutos?.
(e) Calcule el R2 para este modelo. Proporcione una interpretacion de esta cantidad.
(f) Realice los test individuales con = 0,05, H0 : i = 0 vs H1 : i 6= 0, i = 0, 1.
SOLUCION
163
Sxy
1 =
Sxx
0 = y 1 x
Sxx =
5
X
(xi x)2
= 8780
(yi y)2
= 534,8
i=1
Syy =
5
X
i=1
Sxy =
5
X
i=1
ademas
y = 392,8
x = 57
0 = 405,2517
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
164
Captulo 9. An
alisis de Regresi
on
(d) El potencial de pasivacion esperado y, cuando el tiempo de recorrido es de x = 30
minutos es
y = 405,2517 + 0,218451 30 = 398,6982
(e) Para poder calcular el R2 necesitamos
SSE = Syy 1 Sxx = 534,8 0,218451 1918 = 115,811
luego reemplazando tenemos
R2 =
SSR
Syy
=1
SSE
Syy
=1
115,811
534,8
= 0,78345
78,35 %
(f) Se pide docimar hipotesis para 0 = 0 y 1 = 1.
Docimemos primero la siguiente:
H0 : 0 = 0
vs
H1 : 0 6= 0
el estadstico de prueba es
0 0,0
tc = q
V ar()
0 0,0
=r n
o
2
n1 + Sxxx
=r
0 0,0
n
o
SSE
1
x2
+
n2
n
Sxx
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
165
=q
405,2517 0
115,811
572
15 + 8780
52
= 86,38847
La region de rechazo esta dada por
|tc | > t(n(k+1)),1 2 ,
H1 : 6= 1
vs
el estadstico de prueba es
1 1,0
tc = q
V ar(1 )
1 1,0
q
Sxx
0,218451 0
q 115,811
52
8780
= 3,294481
La region de rechazo al igual que el caso anterior esta dada por
|tc | > t(n(k+1)),1 2 ,
166
Captulo 9. An
alisis de Regresi
on
EJERCICIO 6
La presencia de carburos duros en aleaciones de hierro blanco con alto cromo da como
resultado una excelente resistencia a la abrasion, por lo mismo son adecuados para el manejo
de materiales en la industria minera. Los datos de y = perdida por desgaste abrasivo (mm3 ) y
x = contenido de austenita retenida ( %), en pruebas de desgaste de pernos con granete como
abrasivo, fueron analizados con un modelo de regresion lineal simple. Utilice el resultado que
se presenta de MINITAB para contestar las siguientes preguntas:
Cual es la ecuacion de la recta de regresion estimada?
Complete la tabla de analisis de varianza (tabla ANOVA).
Que proporcion de la variacion observada de perdida de desgaste se puede atribuir al
modelo de regresion lineal simple para esa relacion?
Pruebe la utilidad del modelo de regresion lineal simple, use = 0,01.
Estime la perdida real promedio por desgaste cuando el contenido es 50 % ofreciendo
informacion acerca de la confiabilidad y la precision.
Que valor de perdida por desgaste pronosticara cuando el contenido es 30 %, y cual
es el valor del residuo correspondiente, sabiendo que el valor observado fue de 0.80?
Otros datos relevantes:
n
X
x2i = 41574,84
x = 42,32941
i=1
SE Coef
0.09525879
0.00192626
T
8.264
3.930
P
0.0001
0.0013
DF
SS
0.63690
MS
15
1.25551
SOLUCION
(a) Con los datos entregados por la salida de Minitab la recta de regresion estimada es:
y = 0,787218 + 0,007570x
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
167
Fuente
Regresion
Error
Total
Tabla ANOVA
g.l
SS
MS
F
1 0.6369 0.6369 15.443
15 0.6186 0.04124
16 1.2555
(c) Se pide el R2 .
R2 =
SSR
Syy
0,6369
1,255
= 0,5072
50,72 %
luego, el modelo explica un 50.72 % de variabilidad presente en los datos.
(d) Observando el valor-p de x, tenemos que
valor-p = 0,0013 < 0,01 =
Por lo tanto se rechaza la hipotesis H0 : 1 = 0.
(e) La estimacion para la perdida real promedio por desgaste cuando el contenido es 50 %
es:
y = 0,787218 + 0,00757 50 = 1,165718
(f) El valor de perdida por desgaste que pronosticara cuando el contenido es 30 % es:
y = 0,787218 + 0,00757 30 = 1,014318
Sabiendo que le verdadero valor observado fue 0.8, el residuo es
e = y y = 0,8 1,014318 = 0,214318
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
168
Captulo 9. An
alisis de Regresi
on
EJERCICIO 7
Se ha observado que para predecir la demanda (consumo) de combustible para la calefaccion,
resulta ser mas preciso el pronostico a largo plazo de las temperaturas y el uso de la relacion
temperatura-consumo que el tratar de pronosticar directamente analizando las ventas de
combustible. Un distribuidor de combustible mantiene un registro de ventas mensuales de
combustible y de temperaturas maximas en esos meses. A continuacion aparecen los datos
de nueve de estos meses seleccionados al azar.
Ventas (y)
26.2
Temperaturas (x) 46.5
17.4
54.6
7.8 12.3
65.2 62.3
35.9
41.9
42.1
38.6
26.4 19.0
43.7 52.0
10.1
59.8
SOLUCION
(a) Para poder calcular los estimadores de la recta de regresion, necesitamos los siguientes
resultados:
Total
x
y
x2
y2
xy
46.5 26.2 2162.25 686.44 1218.30
54.6 17.4 2981.16 302.76 950.04
65.2
7.8 4251.04
60.84 508.56
62.3 12.3 3881.29 151.29 766.29
41.9 35.9 1755.61 1288.81 1504.21
38.6 42.1 1489.96 1772.41 1625.06
43.7 26.4 1909.69 696.96 1153.68
52.0 19.0 2704.00 361.00 988.00
59.8 10.1 3576.04 102.01 603.98
464.6 197.2 24711.04 5422.52 9318.12
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
169
xi
464,6 X = 51,62
yi
197,6 Y = 21,91
x2i
= 24711,04
yi2
5422,52
xi yi =
9318,12
i=1
9
X
i=1
9
X
i=1
9
X
i=1
9
X
i=1
Sxx =
9
X
= 24711,04 9 (51,62)2
729,4204
= 5422,52 9 (21,91)2
1102,0871
x2i 9X
i=1
Syy =
9
X
yi2 9Y
i=1
Sxy =
9
X
xi yi 9X Y
i=1
Luego
Sxy
860,8278
1 =
=
= 1,180
Sxx
729,4204
0 = Y 1 X = 21,91 + 1,180 51,62 = 82,822
Donde la recta de regresion es:
y = 82,822 1,180x
(b) El grafico de los puntos y la recta de regresion se presenta a continuacion
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
170
Captulo 9. An
alisis de Regresi
on
2 =
SSE
n2
2 =
86,31
= 12,33
7
vs
H1 : 1 6= 0
1
.
se(1 )
171
1,180
T1 =
se(1 )
T1 =
con
se(1 ) =
12,33
= 0,13
729,4204
1,180
9,1
0,13
1 (x0 x)2
+
n
Sxx
Reemplazando
s
1
(45 51,62)2
+
10
729,4204
= 29,72 2,66
= (27,06; 32,38)
(g) R2 = 1
SSE
Syy
=1
86,31
1102,0871
= 0,9268
Existe un 92.68 % de variacion en los datos mensuales que se explica por la temperatura
maxima promedio.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
172
Captulo 9. An
alisis de Regresi
on
EJERCICIO 8
Los siguientes datos se refieren al flujo de cloro (X, en cm3 normales por minuto) por una
boquilla, utilizada en el mecanismo de grabado, y la rapidez de grabado (Y , en 100 A/min).
X
Y
P
P
P
P
Los estadsticos de resumen son: xi = 24,0, x2i = 70,50, yi = 312,5, yi2 = 11626,75,
P
xi yi = 902,25, 0 = 6,448718, 1 = 10,602564.
(a) El modelo de regresion lineal simple especifica una relacion u
til entre el flujo de cloro
y la rapidez de grabado?
(b) Estime el cambio real promedio de rapidez de grabado asociado con un aumento de 1
cm3 normal por minuto en el flujo, con un intervalo de confianza del 95 %, e interprete
el intervalo.
(c) Calcule el intervalo de confianza de 95 % de confianza para Y |x=3 , la rapidez real
promedio de grabado cuando el flujo es igual a 3. Se estimo con precision este promedio?
(d) Calcule el intervalo de prediccion de 95 % de confianza para una sola observacion futura
sobre la rapidez de grabado cuando el flujo es igual a 3. Es probable que la prediccion
sea exacta?
(e) Recomendara calcular un intervalo de prediccion de 95 % para un flujo de 6? Explique.
SOLUCION
H1 : 1 6= 0
vs
El estadstico de prueba es
tc =
1
s.e(1 )
2
Sxx
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
173
Sxx =
9
X
)2
= 70,5 9 ( 24
9
= 11626,75 9 ( 312,5
)2
9
= 776,06
x2i 9X
6,5
i=1
Syy =
9
X
yi2 9Y
i=1
Sxy =
9
X
= 902,25 9 ( 24
)( 312,5
) =
9
9
xi yi 9X Y
i=1
2 =
SSE
n2
Syy 1 Sxy
n2
45,33
7
= 6,48
Luego
s.e(1 ) =
6,48
= 0,998
6,2
10,602564
10,62
0,998
68,92
174
Captulo 9. An
alisis de Regresi
on
(a) como |tc | > 2,365 se rechaza H0
Por lo tanto el modelo de regresion lineal especifica una regresion u
til entre X e Y .
(b) Hay que encontrar un I.C. para 1 :
h
i
1 1 t(n2), 2 s.e(1 )
1 [10,602564 2,365 0,998]
1 [8,2422; 12,9628]
Con un 95 % de confianza, estimamos el cambio real promedio de rapidez de grabado
entre 8.2422 y 12.9628 asociado con un aumento de 1 cm3 normal por minuto en el
flujo.
(c) El intervalo pedido es el siguiente:
s
IC(y/x0 ) =
y/x0 tn2;1 2
1 (x0 x)2
+
n
Sxx
luego necesitamos
X=
24
= 2,67
9
ademas
y/x0 =3 = 0 + 1 x0
= 6,448718 + 10,602564 3
= 38,25641
ahora reemplazando tenemos que
"
1 (3 2,67)2
+
9
6,5
#
175
Se aprecia que s se estimo con precision este promedio, ya que si observamos la tabla
de datos cuando x = 3, el valor de y es 40 y este valor pertenece al I.C.
(d) El intervalo pedido es el siguiente:
s
IC(y0 ) y0 t
n2;1
2
1 (x0 x)2
1+ +
n
Sxx
necesitamos
y0 = 0 + 1 x0
= 6,448718 + 10,602564 3
= 38,25641
Luego reemplazando
s
#
1 (3 2,67)2
y0 38,25641 2,365 6,48 1 + +
9
6,5
"
176
Captulo 9. An
alisis de Regresi
on
Y : Resistencia al corte (psi) X: Diametro de soldadura (0.0001 pulg)
370
400
800
780
1210
1210
1600
1560
1980
2000
2500
2450
3070
3100
3550
3600
3940
4000
4000
3950
(a) Existe evidencia para pensar que el ajuste de una regresion lineal es adecuada?
(b) Docime si la correlacion entre ambas variables es nula.
(c) Determine la recta por mnimos cuadrados.
(d) Calcule las varianzas de los parametros encontrados.
(e) Docime las hipotesis 1 = 1 y 0 = 0, usando un nivel de significacion igual a 0.01.
(f) Rectifique el punto anterior usando intervalos de confianza adecuados.
SOLUCION
(a) La evidencia se puede obtener al graficar los puntos o calcular el coeficiente de correlacion r.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
177
n
X
r=
(xi x)(yi y)
s ni=1
X
(xi x)2
i=1
n
X
i=1
n
= v
u
n
u X
u
x2i
t n
i=1
=p
(yi y)2
n
X
xi yi
i=1
n
X
n
X
xi
n
X
i=1
!2
xi
i=1
yi
i=1
n
X
yi2
n
X
i=1
!2
yi
i=1
156160400
15773690 154614400
156160400
156167846
= 0,9999
Por lo tanto, como r = 0,9999 1 hay una fuerte asociacion lineal entre el diametro
de soldadura, la resistencia al corte, misma conclusion obtenida observando el grafico.
Hay evidencia emprica para pensar que el ajuste de la regresion lineal es adecuado.
(b) La hipotesis que se pide docimar es la siguiente:
Sea : correlacion
H0 : = 0
vs
H1 : > 0
178
Captulo 9. An
alisis de Regresi
on
donde
Zc =
1
2
1+r
1r
ln
21 ln
1+0
10
1
n3
1
2
1+r
1r
ln
1
n3
1
2
ln (1999)
1
7
= 10,05439
considerando = 0,05 tenemos que z10,05 = 1,64.
Luego, como Zc = 10,05439 > z1 = 1,64, existe evidencia suficiente para rechazar
H0 , esto implica que la correlacion entre ambas variables no es nula.
(c) La estimacion de la recta por mnimos cuadrados esta dada por
y =
+ x
donde
y son los estimadores de mnimos cuadrados.
n
X
(xi x)(yi y)
i=1
n
X
(xi x)2
i=1
n
=
n
X
x i yi
i=1
n
X
i=1
n
X
xi
i=1
x2i
n
X
n
X
yi
i=1
!2
xi
i=1
= 0,99
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
179
= y x
= 22,86 0,99 2321
= 2286 2297,79
= 11,79
As la recta es
y = 11,79 + 0,99 x
n
X
=
(d) V ar()
(xi x)2
i=1
n
X
(xi
2 V
ar(yi )
x)2
i=1
2
n
X
(xi x)2
i=1
ahora para
2xCov(y, )
V ar(
) = V ar(y) + x2 V ar()
2
2
+ x2 n
2x 0
X
n
2
(xi x)
i=1
1
x
= 2
+
n
n X
(xi x)2
i=1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
180
Captulo 9. An
alisis de Regresi
on
=
n
n
X
x2i
i=1
n
X
(xi x)2
i=1
=
,
n1
2
donde SCE =
n
X
e2i
i=1
n
X
(yi yi )2
i=1
i=1
2 =
1474,369
= 163,8187
10 1
10
X
i=1
= 163,8187
V ar()
15773690
= 0,00001038557
V ar(
) =
163,8187 69644100
10 15773690
11409007637
157736900
= 72,32935
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
181
vs
H1 : 6= 0
el estadstico de prueba es
tc = p
V ar(
)
11,79 0
=
72,32935
= 1,386298
La region de rechazo esta dada por
|tc | > t(n(k+1)),1 2 ,
vs
H1 : 6= 1
el estadstico de prueba es
tc = q
V ar()
0,99 1
0,00001038557
= 3,103022
La region de rechazo, al igual que el caso anterior, esta dada por
|tc | > t(n(k+1)),1 2 ,
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
182
Captulo 9. An
alisis de Regresi
on
considerando nuevamente = 0,01 (99 % de confianza)
t(n(k+1)),1 2 = t8,0,995 = 3,355387
Como |tc | = 3,103022 t8,0,995 = 3,355387, no existe evidencia suficiente bajo un 99 %
de confianza para rechazar H0 , es decir, el parametro se puede considerar como igual
a uno.
(f) Haremos I.C al 99 % para los parametros y .
El I.C() esta dado por
)
t 2 (n 2) s.e(
h
11,79 3,355387
i
72,32935
[40,32645; 16,74645]
como en el I.C se encuentra el cero, se ratifica lo obtenido en (e)
El I.C() esta dado por
h
t 2 (n 2) s.e()
h
0,99 3,355387
i
0,00001038557
[0,9791867; 1,000813]
como en el I.C se encuentra el uno, tambien se ratifica lo obtenido en (e) para .
EJERCICIO 10
Demuestre que en el modelo de regresion lineal simple
yi = 0 + 1 xi + i
los estimadores 0 y 1 pueden ser escritos como combinaciones lineales de las respuestas yi .
Encuentre explcitamente las constantes en la combinacion lineal.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
183
SOLUCION
Sabemos que al
mn
n
X
0 1
2i
i=1
se obtiene:
0 = y 1 x
n
X
1 =
(xi x)(yi y)
i=1
n
X
(xi x)2
i=1
(xi x)(yi y) =
n
X
i=1
i=1
n
X
i=1
n
X
yi (xi x) y(xi x)
i=1
n
X
yi (xi x) y
n
X
i=1
i=1
n
X
yi (xi x) y 0
i=1
n
X
yi (xi x)
i=1
luego
n
X
1 =
(xi x)
i=1
Sxx
yi =
n
X
di yi
i=1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
(xi x)
184
Captulo 9. An
alisis de Regresi
on
donde di =
(xi x)
Sxx
y Sxx =
n
X
(xi x)2 .
i=1
0 = y
n
X
i=1
n
X
(xi x)
i=1
yi x
Sxx
1
n
(xi x)
Sxx
x yi
ci yi
i=1
n
X
con ci =
1
n
(xi x)
i=1
Sxx
EJERCICIO 11
Demuestre que
n
2 X 2
0 N (0 ,
x) y
nSxx i=1 i
con
Cov(0 , 1 ) =
2
1 N (1 ,
)
Sxx
2x
Sxx
SOLUCION
Como yi N (0 + 1 xi , 2 ) y 0 es combinacion lineal de yi entonces 0 N (, ) donde los
parametros son:
E(0 ) = E
n
X
!
ci E(yi )
i=1
n
X
ci (0 + 1 xi )
i=1
n
X
1
i=1
(xi x)
n
Sxx x
(0 + 1 xi )
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
185
= 0
= 0
n
X
ci + 1
n
X
ci xi
i=1
i=1
n
X
n
X
xi
ci + 1
i=1
i=1
(xi x)xi x
n
Sxx
n
x X
x
(xi x)xi
Sxx i=1
= 0 + 1
x
Sxx
= 0 + 1 x
Sxx
= 0
n
X
V ar(0 ) = V ar
!
ci yi
i=1
ind
n
X
V ar(ci yi )
i=1
n
X
c2i
i=1
"
=
n
1 X 2
x
nSxx i=1 i
para 1
E(1 ) = E
n
X
!
di yi
i=1
n
X
di (0 + 1 xi )
i=1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
186
Captulo 9. An
alisis de Regresi
on
= 0
n
X
di + 1
n
X
i=1
di xi
i=1
n
X
(xi x)xi
= 0 + 1 i=1
Sxx
=0
n
X
V ar(1 ) = V ar
!
di yi
i=1
ind
n
X
d2i
i=1
= 2
n
X
(xi x)2
Sxx
i=1
2
Sxx
Finalmente la covarianza es
Cov(0 , 1 ) = Cov
n
X
ci yi ,
i=1
n X
n
X
n
X
!
di yi
i=1
ci dj Cov(yi , yj )
i=1 j=1
ind
n
X
ci di
i=1
n
X
1
i=1
(xi x)
x
n
Sxx
n
X
1 (xi x)
i=1
Sxx
(xi x)
Sxx
(xi x)2 x
2
Sxx
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
187
x
0
Sxx
2x
Sxx
EJERCICIO 12
Montgomery y Peck (1992) describen el uso de un modelo de regresion para relacionar la
cantidad de tiempo que requiere un vendedor para dar servicio a una maquina expendedora
de refrescos, con el n
umero de envases contenidos en la maquina (X1 ) y la distancia del
vehculo de servicio al sitio donde se encuentra la maquina (X2 ). Los datos se presentan a
continuacion:
Obs.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Y X1
9,95
2
24,45
8
31,75 11
35,00 10
25,02
8
16,86
4
14,38
2
9,60
2
24,35
9
27,50
8
17,08
4
37,00 11
41,95 12
11,66
2
21,65
4
17,89
4
69,00 20
10,30
1
34,93 10
46,59 15
44,88 15
54,12 16
56,23 17
22,13
6
21,15
5
X2
50
110
120
550
295
200
375
52
100
300
412
400
500
360
205
400
600
585
540
250
290
510
590
100
400
SOLUCION
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
188
Captulo 9. An
alisis de Regresi
on
(a) El modelo es el siguiente:
Y = 0 + 1 X1 + 2 X2 +
para calcular el modelo ajustado
Y = 0 + 1 X1 + 2 X2
necesitamos encontrar los estimadores de mnimos cuadrados a partir de
= (X 0 X)1 X 0 Y
luego tenemos que
25
X
25
X
Xi1
Xi2
n
i=1
i=1
25
25
25
X
X
X
0
2
(X X) =
Xi1
Xi1
Xi1 Xi2
i=1
i=1
i=1
25
25
25
X
X
X
2
Xi2
Xi1 Xi2
Xi2
i=1
i=1
25
206
8294
206 2396
77177
=
i=1
(X 0 X)1
25
X
Yi
i=1
25
X
X 0Y =
Xi1 Yi
i=1
25
X
Xi2 Yi
725,42
8001,67
=
274580,71
i=1
0
0,2146526166 0,00749091422 3,403891e 004
725,42
1 = 0,0074909142
0,00167076313 1,891781e 005 8001,67
0,0003403891 0,00001891781
1,495876e 006
274580,71
2
0
2,30920043
1 = 2,74036942
0,01243958
2
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
189
Fuente
Regresion
Error
Total
Tabla ANOVA
g.l
SS
MS
F
k 1 SSR SSR /(k 1) M SR /M SE
n k SSE SSE /(n k)
n 1 SST
SST = Y 0 Y
!2
yi
i=1
= 27133,39 21049,37
= 6084,021
n
X
SSR = X Y
!2
yi
i=1
= 27018,34 21049,37
= 5968,974
SSE = SST SSR
= 115,0465
notese que
2 = S2 =
SSE
,
nk
2 =
115,0465
= 5,229388
25 3
190
Captulo 9. An
alisis de Regresi
on
Fuente
Regresion
Error
Total
Tabla ANOVA
g.l
SS
MS
2 5968.974 2984.487
22 115.0465 5.229388
24 6084.021
F
570.7144
vs
H1 : Al menos un i 6= 0 para i = 1, 2
se rechaza H0
como
FAN OV A = 570,7144 > 3,443357 = F2;22 (0,95)
Se rechaza H0 , es decir, la regresion es significativa.
Al calcular el R2 tenemos que
R2 =
SSR
= 0,9810904
SST
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
9.2.
191
Ejercicios Propuestos
181 193
9.4 15.5
155 172
20.0 22.0
110
35.5
113
43.0
75
94
40.5 33.0
6.6
0.15
15.0
0.81
9.7
0.57
17.3
0.78
10.6
0.70
19.2
0.69
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
14.3
0.60
39.5
1.62
192
Captulo 9. An
alisis de Regresi
on
a) Dibuje un diagrama de dispersion de los datos. En este caso, parece apropiado
el uso de un modelo de regresion lineal simple?
b) Ajuste un modelo de regresion lineal simple utilizando el metodo de mnimos
cuadrados.
c) Estime la concentracion promedio de cloro para una cuenca que tiene un area que
sea el 1 % de la superficie circunvecina.
d ) Encuentre el valor ajustado que corresponde a x = 0,47 as como el residuo
correspondiente.
4. Considere los datos del ejercicio 1. para x = resistencia a la compresion y y = permeabilidad intrnseca del concreto.
a) Pruebe la significancia de la regresion utilizando = 0,05. Encuentre el valor-p
de esta prueba. Puede concluirse que el modelo especifica una relacion lineal u
til
entre las dos variables?
b) Estime 2 y la desviacion estandar de b1 .
c) En este modelo, cual es el error estandar de la ordenada al origen?
5. El ejercicio 3, contiene datos para y = concentracion de cloro y x = area que rodea la
cuenca.
a) Pruebe la hipotesis H0 : 1 = 0 contra H1 : 1 6= 0 utilizando el procedimiento
del analisis de varianza con = 0,01.
b) Encuentre el valor-p de la prueba del inciso a).
c) Estime 2 y los errores estandar de b1 y b0 .
d ) Pruebe que H0 : 0 = 0 contra H1 : 0 6= 0 con = 0,01. Que conclusiones
pueden obtenerse? Parece que el modelo ajustara mejor los datos si se eliminase
la ordenada al origen?
6. Con los datos del ejercicio 1. para x = resistencia a la compresion y y = permeabilidad
intrnseca del concreto:
a) Encuentre un intervalo de confianza del 95 % para la pendiente.
b) Encuentre un intervalo de confianza del 95 % para la ordenada al origen.
c) Encuentre un intervalo de confianza del 95 % para la permeabilidad promedio
cuando x = 2,5.
d ) Encuentre un intervalo de confianza del 95 % para la permeabilidad cuando x =
2,5. Explique por que este intervalo es mayor que el calculado en el inciso c).
7. Con respecto a los datos del ejercicio 2. sobre y = desgaste del acero dulce y x =
viscosidad del aceite:
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
193
194
Captulo 9. An
alisis de Regresi
on
Estadstica 84 71 62 90 83 75 71 76 84 97
IO
85 72 65 93 81 70 73 72 80 98
a) Encuentre la recta de regresion que relaciona el promedio final en estadstica con
el promedio final en IO.
b) Pruebe la significancia de la regresion con = 0,05.
c) Estime el coeficiente de correlacion.
d ) Pruebe la hipotesis de que = 0, utilizando para ello = 0,05.
e) Pruebe la hipotesis de que = 0,5 utilizando = 0,05.
f ) Construya un intervalo de confianza del 95 % para el coeficiente de correlacion.
12. Se observa y se nota la duracion de un ciclo de una maquina automatica.
Segundos 2.10
Frecuencia 16
2.11
28
2.12 2.13
41
74
2.14
149
2.15
256
2.19
19
2.20
11
1
1.00
0
2
3
4
5
6
7
2.18 2.24 2.41 2.59 2.82 3.06
.06 1.20 1.33 1.43 1.75 1.75
a) Grafique los siete puntos de datos en un diagrama de dispersion. Parece ser lineal
la relacion entre la resistencia de corte y el esfuerzo de precompresion?
b) Utilice el metodo de mnimos cuadrados para estimar los parametros del modelo
lineal.
c) Interprete los valores de b0 y b1 .
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
195
14. El artculo Some Field Experience in the Use of an Accelerated Method in Estimating
28Day Strength of Concrete(J. Amer. Concrete Institute, 1969, p. 895) considero la regresion de la resistencia estandar de curado y = 28 das (en lb/pulg2 ) contra
x = resistencia acelerada (en lb/pulg2 ). Suponga que la ecuacion de la verdadera recta
de regresion es y = 1800 + 1,3x.
(a) Cual es el valor esperado de la resistencia de 28 das cuando la resistencia acelerada = 2500?.
(b) Cuanto podemos esperar que cambie la resistencia de 28 das cuando la resistencia acelerada aumenta en 1 lb/pulg2 .
(c) Conteste el inciso (b) para un aumento de 100 lb/pulg2 .
(d) Conteste el inciso (b) para una disminucion de 100 lb/pulg2 .
15. Refierase al estudio de Vietnam expuestos al agente Naranja (y la dioxina 2,3,7,8TCDD). La tabla de datos, que se reproduce a continuacion, proporciona las cantidades
de 2,3,7,8-TCDD (medidas en partes por millon) tanto en plasma sanguneo como un
tejido graso extrados de cada uno de los 20 veteranos estudiados. Un objetivo de
los investigadores es determinar el grado de asociacion lineal entre el nivel de dioxina
observado en plasma sanguneo y en tejido graso. Si se puede establecer una asociacion
lineal entre las dos variables, los investigadores querran construir modelos para: (1)
predecir el nivel de 2,3,7,8-TCDD observado en tejido graso y (2) predecir el nivel en
tejido graso a partir del nivel en plasma sanguneo.
Veterano
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
196
Captulo 9. An
alisis de Regresi
on
a) Encuentre las ecuaciones de prediccion que necesitan los investigadores. Interprete
los resultados.
b) Pruebe la hipotesis de que el nivel en tejido graso (x) sirve para predecir linealmente el nivel en plasma sanguneo (y). Utilice = 0,05.
c) Pruebe la hipotesis de que el nivel en plasma sanguneo (x) sirve para predecir
linealmente el nivel en tejido graso (y). Utilice = 0,05.
d ) Intuitivamente, por que deben coincidir los resultados de los incisos b) y c)?
16. Se realizo un experimento con objeto de estudiar el agrietamiento por esfuerzos de
corrosion de acero inoxidable tipo 304 en un entorno simulado de reactor con agua
en ebullicion (T ransactions of the ASM E, enero de 1986). Seis especmenes de acero
inoxidable se recocieron y se sensibilizaron en agua a 289 C con oxgeno y sulfato
disueltos, sometiendolos a diversos factores de intensidad de esfuerzo (es decir, cargas).
La tabla presenta la carga maxima y la rapidez de crecimiento de grietas resultante
(en metros por segundo) para los seis especmenes.
Carga maxima
1
x, M P a m 2
Rapidez de crecimiento
de grietas y, m/s 1010
30.0
35.6 41.5
50.2
55.5
61.1
1.0
2.2
5.8
5.0
14.0
3.9
197
c) Realice una prueba para determinar si el modelo de la Ley de Fitts es estadsticamente adecuado para predecir el tiempo de realizacion de las tareas. Utilice
= 0,05.
d ) Calcule el coeficiente de determinacion, r2 . Interprete el resultado.
18. Refierase al experimento, informado en Combustion and F lame, de difusividad del
oxgeno. Los datos para las nueve muestras de mezcla de nitrogeno y oxigeno se reproducen en la siguiente tabla.
Temperatura
x
1,000
1,100
1,200
1,300
1,400
1,500
1,600
1,700
1,800
Difusividad de oxgeno
y
1.69
1.99
2.31
2.65
3.01
3.39
3.79
4.21
4.64
198
Captulo 9. An
alisis de Regresi
on
20. Los siguientes estadsticos de resumen se obtuvieron de un estudio que utilizo el analisis
de regresion para investigar la relacion entre la flexion de un pavimento y la temperatura superficial del pavimento de varios lugares de una carretera estatal. Aqu x =
temperatura (o F) e y = factor de ajuste de flexion (y 0):
n = 15
X
x2i = 139037,25
X
xi = 1425
yi = 10,68
X
X
xi yi = 987,645
yi2 = 7,85183
C en lugar de
i = 1, . . . , n
2 2 3
5 6 9
4
11
4
13
22. El concreto sin finos, preparado con un agregado grueso clasificado uniformemente y
una pasta de cemento y agua, es bueno en zonas de lluvia excesiva por sus excelentes
propiedades de drenado. El artculo Pavement Thickness Design for No-Fines
Concrete Parking Lots. (J. of Transporting Engr., 1995, pp. 476484) describe el
empleo de un analisis de mnimos cuadrados para estudiar la forma como y = porosidad
( %) se relaciona con x = peso unitario (lb/pie3 ) en especmenes de concreto. Utilice
el resultado que se presenta del software MINITAB para contestar las siguientes preguntas:
(a) Cual es la ecuacion de la recta de regresion estimada?.
(b) Interprete el valor estimado de 1 .
(c) Construya un intervalo de confianza de 95 % para 1 . A partir del intervalo de confianza Puede concluir que la variable x es significativa en el modelo de regresion
simple?.
(d) Cual es la estimacion de ?.
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
199
Coef
118,910
-0,90473
SE
4,499
0,04109
Coef T
26,43
-22,02
P
0,000
0,000
Analysis of Variance
Source
Regression
Residual Error
Total
DF
1
13
14
SS
426,62
11,44
438,06
MS
426,62
0,88
F
484,84
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
P
0,000
200
Captulo 9. An
alisis de Regresi
on
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
Ap
endice A
Formulario de Distribuciones
X B(p)
P (X = x)
E(X)
V (X)
MX (t)
RX (x)
px (1 p)1x
pq
q + pet
0, 1
np
npq
(q + pet )n
0, 1, ..., n
1
p
q
p2
r
p
rq
p
np
n
nM
( N M
)( N
)
N
N
N 1
a+b
2
(ba)2
12
1
2
et+
(1 t)
x>0
r
2
r
( t
)
x>0
n x
p (1
x
X Bin(n, p)
pq x1
X G(p)
x1 r xr
p q
r1
X Bineg(r, p)
X H(M, N, n)
X N (, 2 )
N M
1
,
ba
0,
a<x<b
e.o.c.
ex
1
e
2 2
pet
1qet
, si qet < 1
pe
[ 1qe
]r , si qet < 1
1,2,...
r, r + 1, ...
nx
x e
x!
X E()
M
x
N
n
X P ( = t)
X U (a, b)
p)nx
(x)2
2 2
0, 1, ..., mn(M, n)
e(e
1)
etb eat
t(ba)
,t
2 t2
2
0,1,...
0, 1, 2, ...
X Gamma(, )
X Erlang(r, )
x(1) e
()
r xr1 ex
(r1)!
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
II
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
Ap
endice B
Formulario de An
alisis de Regresi
on
Simple
1. Modelo de Regresi
on Estimado
y =0 + 1 x
0 =y 1 x
n
X
n
X
xi yi
i=1
i=1
n
X
x2i
yi
1 = i=1
n
X
n
X
xi
!2
xi
i=1
i=1
2. Suma de cuadrados
n
X
a) Sxx =
n
X
(xi x)2 =
i=1
n
X
x2i
b) Syy =
(yi y)2 =
i=1
yi2
i=1
i=1
n
X
xi
i=1
n
X
n
X
!2
!2
yi
i=1
.
n
X
c) Sxy =
n
X
i=1
(xi x)(yi y) =
n
X
i=1
xi yi
i=1
xi
n
X
yi
i=1
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
IV
Captulo B. Formulario de An
alisis de Regresi
on Simple
d ) SSE = Syy 1 Sxy .
e) SSR = 1 Sxy .
f ) SST = SSR + SSE = Syy
3. Varianzas y Desviaciones Est
andar
a)
2 =
SSE
n2
b) se(0 ) =
c) se(1 ) =
r
2 n1 +
q
x2
Sxx
2
Sxx
4. Test de Hip
otesis para los coeficientes
a) H0 : 0 = 0 H1 : 0 6= 0
T0 =
0
se(0 )
T1 =
1
se(1 )
b) H0 : 1 = 0 H1 : 1 6= 0
2
1
(x
x)
0
2 1 + +
n
Sxx
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
V
c) Intervalo de Confianza para la respuesta media, donde
y|x0 = 0 + 1 x0
s
IC(y|x0 ) =
y|x0 tn2,1/2
1 (x0 x)2
+
n
Sxx
6. Coeficiente de Determinaci
on R2
Sxy
SSE
R2 = 1
=1
Syy
Syy
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
VI
Captulo B. Formulario de An
alisis de Regresi
on Simple
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
Ap
endice C
Tablas de distribuci
on
C.1.
Distribuci
on t de Student
gl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
0.20
1.38
1.06
0.98
0.94
0.92
0.91
0.90
0.89
0.88
0.88
0.88
0.87
0.87
0.87
0.87
0.86
0.86
0.86
0.86
0.86
0.86
0.86
0.86
0.86
0.86
0.86
0.86
0.85
0.85
0.85
0.84
0.15
1.96
1.39
1.25
1.19
1.16
1.13
1.12
1.11
1.10
1.09
1.09
1.08
1.08
1.08
1.07
1.07
1.07
1.07
1.07
1.06
1.06
1.06
1.06
1.06
1.06
1.06
1.06
1.06
1.06
1.05
1.04
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
0.0005
636.58
31.60
12.92
8.61
6.87
5.96
5.41
5.04
4.78
4.59
4.44
4.32
4.22
4.14
4.07
4.01
3.97
3.92
3.88
3.85
3.82
3.79
3.77
3.75
3.73
3.71
3.69
3.67
3.66
3.65
3.29
VIII
C.2.
Distribuci
on 2
gl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
gl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Proporci
on del Area hasta +
0.995 0.99 0.975 0.95 0.90 0.75
0.00
0.00
0.00
0.00 0.02 0.10
0.01
0.02
0.05
0.10 0.21 0.58
0.07
0.11
0.22
0.35 0.58 1.21
0.21
0.30
0.48
0.71 1.06 1.92
0.41
0.55
0.83
1.15 1.61 2.67
0.68
0.87
1.24
1.64 2.20 3.45
0.99
1.24
1.69
2.17 2.83 4.25
1.34
1.65
2.18
2.73 3.49 5.07
1.73
2.09
2.70
3.33 4.17 5.90
2.16
2.56
3.25
3.94 4.87 6.74
2.60
3.05
3.82
4.57 5.58 7.58
3.07
3.57
4.40
5.23 6.30 8.44
3.57
4.11
5.01
5.89 7.04 9.30
4.07
4.66
5.63
6.57 7.79 10.17
4.60
5.23
6.26
7.26 8.55 11.04
5.14
5.81
6.91
7.96 9.31 11.91
5.70
6.41
7.56
8.67 10.09 12.79
6.26
7.01
8.23
9.39 10.86 13.68
6.84
7.63
8.91 10.12 11.65 14.56
0.25
1.32
2.77
4.11
5.39
6.63
7.84
9.04
10.22
11.39
12.55
13.70
14.85
15.98
17.12
18.25
19.37
20.49
21.60
22.72
Proporci
on
0.10 0.05
2.71 3.84
4.61 5.99
6.25 7.81
7.78 9.49
9.24 11.07
10.64 12.59
12.02 14.07
13.36 15.51
14.68 16.92
15.99 18.31
17.28 19.68
18.55 21.03
19.81 22.36
21.06 23.68
22.31 25.00
23.54 26.30
24.77 27.59
25.99 28.87
27.20 30.14
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
0.50
0.45
1.39
2.37
3.36
4.35
5.35
6.35
7.34
8.34
9.34
10.34
11.34
12.34
13.34
14.34
15.34
16.34
17.34
18.34
0.001
10.83
13.82
16.27
18.47
20.51
22.46
24.32
26.12
27.88
29.59
31.26
32.91
34.53
36.12
37.70
39.25
40.79
42.31
43.82
C.3 Distribuci
on F ( = 0,05)
C.3.
IX
Distribuci
on F ( = 0,05)
Grados de libertad
denominador
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
30
40
60
120
1
161
18.5
10.1
7.71
6.61
5.99
5.59
5.32
5.12
4.96
4.84
4.75
4.67
4.60
4.54
4.49
4.45
4.41
4.38
4.35
4.32
4.30
4.28
4.26
4.24
4.17
4.08
4.00
3.92
3.84
Grados
2
3
199 216
19.0 19.2
9.55 9.28
6.94 6.59
5.79 5.41
5.14 4.76
4.74 4.35
4.46 4.07
4.26 3.86
4.10 3.71
3.98 3.59
3.89 3.49
3.81 3.41
3.74 3.34
3.68 3.29
3.63 3.24
3.59 3.20
3.55 3.16
3.52 3.13
3.49 3.10
3.47 3.07
3.44 3.05
3.42 3.03
3.40 3.01
3.39 2.99
3.32 2.92
3.23 2.84
3.15 2.76
3.07 2.68
3.00 2.60
de libertad
4
5
225 230
19.2 19.3
9.12 9.01
6.39 6.26
5.19 5.05
4.53 4.39
4.12 3.97
3.84 3.69
3.63 3.48
3.48 3.33
3.36 3.20
3.26 3.11
3.18 3.03
3.11 2.96
3.06 2.90
3.01 2.85
2.96 2.81
2.93 2.77
2.90 2.74
2.87 2.71
2.84 2.68
2.82 2.66
2.80 2.64
2.78 2.62
2.76 2.60
2.69 2.53
2.61 2.45
2.53 2.37
2.45 2.29
2.37 2.21
para
6
234
19.3
8.94
6.16
4.95
4.28
3.87
3.58
3.37
3.22
3.09
3.00
2.92
2.85
2.79
2.74
2.70
2.66
2.63
2.60
2.57
2.55
2.53
2.51
2.49
2.42
2.34
2.25
2.18
2.10
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
el numerador
7
8
9
237 239 241
19.4 19.4 19.4
8.89 8.85 8.81
6.09 6.04 6.00
4.88 4.82 4.77
4.21 4.15 4.10
3.79 3.73 3.68
3.50 3.44 3.39
3.29 3.23 3.18
3.14 3.07 3.02
3.01 2.95 2.90
2.91 2.85 2.80
2.83 2.77 2.71
2.76 2.70 2.65
2.71 2.64 2.59
2.66 2.59 2.54
2.61 2.55 2.49
2.58 2.51 2.46
2.54 2.48 2.42
2.51 2.45 2.39
2.49 2.42 2.37
2.46 2.40 2.34
2.44 2.37 2.32
2.42 2.36 2.30
2.40 2.34 2.28
2.33 2.27 2.21
2.25 2.18 2.12
2.17 2.10 2.04
2.09 2.02 1.96
2.01 1.94 1.88
10
242
19.4
8.79
5.96
4.74
4.06
3.64
3.35
3.14
2.98
2.85
2.75
2.67
2.60
2.54
2.49
2.45
2.41
2.38
2.35
2.32
2.30
2.27
2.25
2.24
2.16
2.08
1.99
1.91
1.83
12
244
19.4
8.74
5.91
4.68
4.00
3.57
3.28
3.07
2.91
2.79
2.69
2.60
2.53
2.48
2.42
2.38
2.34
2.31
2.28
2.25
2.23
2.20
2.18
2.16
2.09
2.00
1.92
1.83
1.75
Grados de
15
20
246 248
19.4 19.4
8.70 8.66
5.86 5.80
4.62 4.56
3.94 3.87
3.51 3.44
3.22 3.15
3.01 2.94
2.85 2.77
2.72 2.65
2.62 2.54
2.53 2.46
2.46 2.39
2.40 2.33
2.35 2.28
2.31 2.23
2.27 2.19
2.23 2.16
2.20 2.12
2.18 2.10
2.15 2.07
2.13 2.05
2.11 2.03
2.09 2.01
2.01 1.93
1.92 1.84
1.84 1.75
1.75 1.66
1.67 1.57
libertad para el
24
30
40
249 250 251
19.5 19.5 19.5
8.64 8.62 8.59
5.77 5.75 5.72
4.53 4.50 4.46
3.84 3.81 3.77
3.41 3.38 3.34
3.12 3.08 3.04
2.90 2.86 2.83
2.74 2.70 2.66
2.61 2.57 2.53
2.51 2.47 2.43
2.42 2.38 2.34
2.35 2.31 2.27
2.29 2.25 2.20
2.24 2.19 2.15
2.19 2.15 2.10
2.15 2.11 2.06
2.11 2.07 2.03
2.08 2.04 1.99
2.05 2.01 1.96
2.03 1.98 1.94
2.01 1.96 1.91
1.98 1.94 1.89
1.96 1.92 1.87
1.89 1.84 1.79
1.79 1.74 1.69
1.70 1.65 1.59
1.61 1.55 1.50
1.52 1.46 1.39
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
numerador
60 120
252 253
19.5 19.5
8.57 8.55
5.69 5.66
4.43 4.40
3.74 3.70
3.30 3.27
3.01 2.97
2.79 2.75
2.62 2.58
2.49 2.45
2.38 2.34
2.30 2.25
2.22 2.18
2.16 2.11
2.11 2.06
2.06 2.01
2.02 1.97
1.98 1.93
1.95 1.90
1.92 1.87
1.89 1.84
1.86 1.81
1.84 1.79
1.82 1.77
1.74 1.68
1.64 1.58
1.53 1.47
1.43 1.35
1.32 1.22
254
19.5
8.53
5.63
4.37
3.67
3.23
2.93
2.71
2.54
2.40
2.30
2.21
2.13
2.07
2.01
1.96
1.92
1.88
1.84
1.81
1.78
1.76
1.73
1.71
1.62
1.51
1.39
1.25
1.00
C.4 Distribuci
on Normal
C.4.
z
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
3.1
3.2
3.3
3.4
3.5
XI
Distribuci
on Normal
0.0
0.5000
0.5398
0.5793
0.6179
0.6554
0.6915
0.7257
0.7580
0.7881
0.8159
0.8413
0.8643
0.8849
0.9032
0.9192
0.9332
0.9452
0.9554
0.9641
0.9713
0.9772
0.9821
0.9861
0.9893
0.9918
0.9938
0.9953
0.9965
0.9974
0.9981
0.9987
0.9990
0.9993
0.9995
0.9997
0.9998
0.01
0.5040
0.5438
0.5832
0.6217
0.6591
0.6950
0.7291
0.7611
0.7910
0.8186
0.8438
0.8665
0.8869
0.9049
0.9207
0.9345
0.9463
0.9564
0.9649
0.9719
0.9778
0.9826
0.9864
0.9896
0.9920
0.9940
0.9955
0.9966
0.9975
0.9982
0.9987
0.9991
0.9993
0.9995
0.9997
0.9998
0.02
0.5080
0.5478
0.5871
0.6255
0.6628
0.6985
0.7324
0.7642
0.7939
0.8212
0.8461
0.8686
0.8888
0.9066
0.9222
0.9357
0.9474
0.9573
0.9656
0.9726
0.9783
0.9830
0.9868
0.9898
0.9922
0.9941
0.9956
0.9967
0.9976
0.9982
0.9987
0.9991
0.9994
0.9995
0.9997
0.9998
Segunda cifra
0.03
0.04
0.5120 0.5160
0.5517 0.5557
0.5910 0.5948
0.6293 0.6331
0.6664 0.6700
0.7019 0.7054
0.7357 0.7389
0.7673 0.7704
0.7967 0.7995
0.8238 0.8264
0.8485 0.8508
0.8708 0.8729
0.8907 0.8925
0.9082 0.9099
0.9236 0.9251
0.9370 0.9382
0.9484 0.9495
0.9582 0.9591
0.9664 0.9671
0.9732 0.9738
0.9788 0.9793
0.9834 0.9838
0.9871 0.9875
0.9901 0.9904
0.9925 0.9927
0.9943 0.9945
0.9957 0.9959
0.9968 0.9969
0.9977 0.9977
0.9983 0.9984
0.9988 0.9988
0.9991 0.9992
0.9994 0.9994
0.9996 0.9996
0.9997 0.9997
0.9998 0.9998
decimal en z
0.05
0.06
0.5199 0.5239
0.5596 0.5636
0.5987 0.6026
0.6368 0.6406
0.6736 0.6772
0.7088 0.7123
0.7422 0.7454
0.7734 0.7764
0.8023 0.8051
0.8289 0.8315
0.8531 0.8554
0.8749 0.8770
0.8944 0.8962
0.9115 0.9131
0.9265 0.9279
0.9394 0.9406
0.9505 0.9515
0.9599 0.9608
0.9678 0.9686
0.9744 0.9750
0.9798 0.9803
0.9842 0.9846
0.9878 0.9881
0.9906 0.9909
0.9929 0.9931
0.9946 0.9948
0.9960 0.9961
0.9970 0.9971
0.9978 0.9979
0.9984 0.9985
0.9989 0.9989
0.9992 0.9992
0.9994 0.9994
0.9996 0.9996
0.9997 0.9997
0.9998 0.9998
Recopilaci
on, Organizaci
on y Elaboraci
on por Patricia Jim
enez P. & Ricardo Olea O.
0.07
0.5279
0.5675
0.6064
0.6443
0.6808
0.7157
0.7486
0.7794
0.8078
0.8340
0.8577
0.8790
0.8980
0.9147
0.9292
0.9418
0.9525
0.9616
0.9693
0.9756
0.9808
0.9850
0.9884
0.9911
0.9932
0.9949
0.9962
0.9972
0.9979
0.9985
0.9989
0.9992
0.9995
0.9996
0.9997
0.9998
0.08
0.5319
0.5714
0.6103
0.6480
0.6844
0.7190
0.7517
0.7823
0.8106
0.8365
0.8599
0.8810
0.8997
0.9162
0.9306
0.9429
0.9535
0.9625
0.9699
0.9761
0.9812
0.9854
0.9887
0.9913
0.9934
0.9951
0.9963
0.9973
0.9980
0.9986
0.9990
0.9993
0.9995
0.9996
0.9997
0.9998
0.09
0.5359
0.5753
0.6141
0.6517
0.6879
0.7224
0.7549
0.7852
0.8133
0.8389
0.8621
0.8830
0.9015
0.9177
0.9319
0.9441
0.9545
0.9633
0.9706
0.9767
0.9817
0.9857
0.9890
0.9916
0.9936
0.9952
0.9964
0.9974
0.9981
0.9986
0.9990
0.9993
0.9995
0.9997
0.9998
0.9998