Professional Documents
Culture Documents
12/01/10 /1
APELLIDOS, NOMBRE:_____________________________________________________
2.- Tres elementos electrónicos están en una placa base según una configuración de fiabilidad tal y
como se muestra en la figura de abajo.
1 2
El primer elemento sigue una distribución exponencial de media 50 horas, el segundo una
distribución normal de media 100 horas y desviación típica 20 horas, y el tercer elemento sigue una
distribución uniforme entre 10 y 200 horas. Calcular la probabilidad de que el sistema esté
funcionando al cabo de 70 horas. (2 puntos)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 /3
3.- Para estimar la media poblacional de una variable aleatoria tomamos una muestra aleatoria de
n=5 valores y utilizamos dos estimadores diferentes:
a) la media muestral de los 5 valores
b) obtenemos la media muestral de los dos primeros valores y la media muestral de los tres últimos
valores y después obtenemos el promedio de las dos medias.
Calcular la media y la varianza de ambos estimadores y decidir cuál es el mejor. (2 puntos)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 /4
5.- La duración en minutos de una llamada telefónica de larga distancia, se asimila a una variable
aleatoria X cuya función de distribución es
x 2 / 16 si [ ]
x ∈ 0, 4
F ( x) = 0 si x<0
1 si x>4
Determinar:
a) la duración media de este tipo de llamadas telefónicas. (1 punto)
b) si una llamada lleva un minuto, probabilidad de que no pase de los 3 minutos. (1 punto)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 /6
APELLIDOS, NOMBRE:_____________________________________________________
pH=7 pH=8
Temperatura 30ºC 194 186 174 190 189 194 x 30 =187,83
Temperatura 35ºC 173 179 166 182 172 177 x 35 =174,83
x pH7 =178,67 x pH8 =184
La tabla de resultados del ANOVA se muestra a continuación, en la cual se han ocultado 4 valores.
No se incluye la interacción porque ésta no es estadísticamente significativa (p-valor=0,8).
Analysis of Variance for RENDIMIENTO - Type III Sums of Squares
--------------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
--------------------------------------------------------------------------------
MAIN EFFECTS
A:Temperatura 507,0 1 ¦¦¦¦¦ ¦¦¦¦¦ 0,0059
B:pH ¦¦¦¦¦¦¦ 1 85,3333 2,17 0,1750
b) Dado que el p-valor asociado a pH es mayor que 0,05 puede considerarse que el pH no ejerce un
efecto estadísticamente significativo en el rendimiento (asumiendo α=0,05). Justificar cómo se
podría llegar a la misma conclusión a partir de los datos de la tabla si no se conociera el p-valor.
(2 puntos)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 /7
c) Teniendo en cuenta los resultados del ANOVA y considerando un nivel de significación del 5%,
¿qué temperatura y qué pH deberá utilizarse para maximizar el rendimiento del proceso?
(2 puntos)
- En este caso el ANOVA es preferible al análisis de regresión ya que permite estudiar si hay
interacción entre los dos factores, lo cual no puede estudiarse con regresión. (2 puntos)
2.- Una mediana empresa constructora ha contabilizado el número de accidentes leves y graves de
sus trabajadores que se han producido en los últimos cinco años. Estos datos están disponibles para
los trabajadores con menos de 3 años de experiencia laboral y para los de más de 3 años de
experiencia. La siguiente tabla, obtenida con Statgraphics, muestra el número de accidentes
contabilizado por la empresa (frecuencias observadas) y los resultados del análisis estadístico.
Frequency Table
Row
Exp.<3 Exp.>3 Total
---------------------------
accid_grave | 15 | 9 | 24
| 13,58 | 10,42 | 22,64%
--------------------------- Cell contents:
accid_leve | 45 | 37 | 82 Observed frequency
| 46,42 | ¦¦¦¦¦¦| 77,36% Expected frequency
---------------------------
Column 60 46 106
Total 56,60% 43,40% 100,00%
b) Calcular la frecuencia esperada de accidentes leves sufridos por trabajadores con más de 3 años
de experiencia (valor ocultado en la tabla). (2,5 puntos)
c) Calcular el p-valor sabiendo que el estadístico de contraste asociado al test chi-cuadrado vale
0,44. (2,5 puntos)
APELLIDOS, NOMBRE:_____________________________________________________
1.- Dos máquinas producen una misma pieza mecánica. La dimensión de las piezas producidas por
la máquina A sigue una distribución normal de media 8,3 mm y desviación típica 1,2 mm; la
dimensión de las piezas producidas por la máquina B sigue una distribución normal de media 8,5
mm y desviación típica 1,4 mm. El 75% de las piezas son producidas por la máquina A. Las
tolerancias de la pieza son 8,2 ± 1,6 mm. Se considera que una pieza es defectuosa cuando la
dimensión de la pieza está fuera de tolerancias. Se pide:
a) Si escogemos una pieza al azar de la producción global de la empresa, y resulta ser defectuosa,
¿cuál es la probabilidad de que la pieza haya sido producida por la máquina B? (3 puntos)
c) Si preparamos un container con 1000 piezas, ¿cuál es la probabilidad de que contenga menos de
45 piezas defectuosas? (En este apartado supondremos que la proporción de defectuosas del lote
es del 5%). (2 puntos)
d) Para aceptar o rechazar el container anterior (1000 piezas y p=0,05), el cliente examina 30
piezas al azar. Si de entre esas 30 hay cero defectuosas, se acepta el container; si hay más de 1,
se rechaza el container; pero si hay exactamente 1, se toman 30 piezas más al azar, y si del
conjunto de las 60 piezas elegidas hay al menos 2 defectuosas, se rechaza el lote, caso contrario
se acepta. Calcular :
- el número medio de piezas que se inspeccionan mediante este método de aceptación (1,5 p.)
- la probabilidad de aceptar el container. (1,5 puntos)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 / 10
2.- El gasto familiar diario en alimentación en una ciudad es habitualmente una variable aleatoria
con distribución X≈N(m, 3) expresado en euros. También sabemos que el 15,9% de las familias
gasta menos de 14 € diarios. Queremos saber si la “cuesta de enero” está provocando, o no, una
reducción significativa del gasto promedio en alimentación. A lo largo de estos primeros días de
enero se ha encuestado a un total de 10 familias obteniéndose un gasto medio muestral de 16 € y
una cuasidesviación típica de 2,5 €.
a) Calcular los datos necesarios y plantear el test apropiado para la comprobación que queremos
hacer. (3 puntos)
b) ¿Cuál sería la decisión a tomar considerando un nivel de significación del 5%? (2,5 puntos)
c) Con el test planteado, ¿cuál sería β si la media del gasto fuera realmente m=15 €? (3 puntos)
d) ¿A cuántas familias habría que encuestar para que el error absoluto de la estimación, realizada a
partir de la media muestral, fuera menor que 1 € con un nivel de confianza del 99%? (1,5 puntos)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 / 11
APELLIDOS, NOMBRE:_____________________________________________________
SOLUCIÓN:
σ c2 = σ 2y ⋅ (1 − ρ 2 ) = 4 ⋅ (1 − 0,92 ) = 0,76 à σ c = 0,87
[ ] 7 − mc
P(Yc < 7) = 0,60 ; P N ( mc , 0,87) < 7 = 0,6 ; φ = 0,6 ; φ (0, 255) = 0,6 ;
7 − mc
= 0,255
0,87 0,87
σ 2
mc = 6,78 ; mc = my + ρ y ( x − mx ) ; m c = 6,78 = 6 + 0,9 ( x0 − 110) à x0 = 113,03 km/h
σx 7
2.- Tres elementos electrónicos están en una placa base según una configuración de fiabilidad tal y
como se muestra en la figura de abajo.
1 2
El primer elemento sigue una distribución exponencial de media 50 horas, el segundo una
distribución normal de media 100 horas y desviación típica 20 horas, y el tercer elemento sigue una
distribución uniforme entre 10 y 200 horas. Calcular la probabilidad de que el sistema esté
funcionando al cabo de 70 horas. (2 puntos)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 / 12
SOLUCIÓN:
1
x1 ≡ EXP ( λ = )
50
x 2 ≡ N(100 ;20 )
X3 ≡ U[10;200 ]
Calculamos la probabilidad de que cada la duración uno de estos componentes sea superior a 70
horas.
70
−
P( X1 ≥ 70 ) = e −λ·x = e 50 = 0,247
70 − 100
P( X2 ≥ 70 ) = 1 − P( X 2 ≤ 70 ) = 1 − φ = 1 − φ( −1,5) = 1 − 0,067 = 0,933
20
70 − 10
P( X3 ≥ 70 ) = 1 − P( X 3 ≤ 70 ) = 1 − Fx ( 70 ) = 1 − = 0,684
200 − 10
Llamando a Ri la probabilidad de que el componente i dure más de 70 horas. La probabilidad de
que el sistema funcione al cabo de 70 horas es,
3.- Para estimar la media poblacional de una variable aleatoria tomamos una muestra aleatoria de
n=5 valores y utilizamos dos estimadores diferentes:
a) la media muestral de los 5 valores
b) obtenemos la media muestral de los dos primeros valores y la media muestral de los tres últimos
valores y después obtenemos el promedio de las dos medias.
SOLUCIÓN:
Σx
a) x = i = 1 2
n
x + x + x3 + x4 + x5
5
()
à E x =m ; σ2 x = () σ 2 σ2
n
=
5
= 0,2σ 2
x1 + x2 x3 + x4 + x5
+ x + x2 x3 + x 4 + x5
b) θ = 2 3 = 1 +
2 4 6
E (θ ) = [E ( x1 ) + E ( x2 )] + [E( x3 ) + E ( x4 ) + E( x5 )] =
1 1 2m 3m
+ =m
4 6 4 6
D 2 (θ ) =
1 2
16
[
D ( x1 ) + D 2 ( x2 ) +] 1
36
[
D 2 ( x3 ) + D 2 ( x4 ) + D 2 ( x5 ) = ]
1 1 1 1
= 2σ 2 + 3σ 2 = σ 2 + σ 2 = 0, 2083σ 2
16 36 8 12
Tiene menor varianza la media de los 5 valores.
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 / 13
SOLUCIÓN:
n −1 n − 1 30 ⋅ 3
( )
P s '2 > 30 = P 2 s '2 > 30 2 = P χ32 > 2
(
= P χ 32 > 6,944 = 0,074)
σ σ 3,6
5.- La duración en minutos de una llamada telefónica de larga distancia, se asimila a una variable
aleatoria X cuya función de distribución es
x 2 / 16 si [ ]
x ∈ 0, 4
F ( x) = 0 si x<0
1 si x>4
Determinar:
a) la duración media de este tipo de llamadas telefónicas. (1 punto)
b) si una llamada lleva un minuto, probabilidad de que no pase de los 3 minutos. (1 punto)
SOLUCIÓN:
4
dF ( x) x +∞ 4 x x3 43 8
a) f ( x ) = = ; E ( x ) = ∫ x ⋅ f ( x ) dx = ∫ x ⋅ dx = = =
−∞
dx 8 0 8 24 0 24 3
x
[ ]
3
APELLIDOS, NOMBRE:_____________________________________________________
pH=7 pH=8
Temperatura 30ºC 194 186 174 190 189 194 x 30 =187,83
Temperatura 35ºC 173 179 166 182 172 177 x 35 =174,83
x pH7 =178,67 x pH8 =184
La tabla de resultados del ANOVA se muestra a continuación, en la cual se han ocultado 4 valores.
No se incluye la interacción porque ésta no es estadísticamente significativa (p-valor=0,8).
Analysis of Variance for RENDIMIENTO - Type III Sums of Squares
--------------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
--------------------------------------------------------------------------------
MAIN EFFECTS
A:Temperatura 507,0 1 ¦¦¦¦¦ ¦¦¦¦¦ 0,0059
B:pH ¦¦¦¦¦¦¦ 1 85,3333 2,17 0,1750
b) Dado que el p-valor asociado a pH es mayor que 0,05 puede considerarse que el pH no ejerce un
efecto estadísticamente significativo en el rendimiento (asumiendo α=0,05). Justificar cómo se
podría llegar a la misma conclusión a partir de los datos de la tabla si no se conociera el p-valor.
(2 puntos)
c) Teniendo en cuenta los resultados del ANOVA y considerando un nivel de significación del 5%,
¿qué temperatura y qué pH deberá utilizarse para maximizar el rendimiento del proceso?
(2 puntos)
- En este caso el ANOVA es preferible al análisis de regresión ya que permite estudiar si hay
interacción entre los dos factores, lo cual no puede estudiarse con regresión. (2 puntos)
Falso, ya que con regresión también es posible estudiar el efecto de la interacción. En este caso las
dos técnicas son equivalentes al tratarse de dos factores cuantitativos a dos niveles, y por esa razón
el p-valor de temperatura y pH es el mismo con ambas técnicas.
Falso, pues el factor pH no es significativo, lo cual implica que si el pH aumenta una unidad, el
rendimiento no aumentará en promedio.
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 / 16
2.- Una mediana empresa constructora ha contabilizado el número de accidentes leves y graves de
sus trabajadores que se han producido en los últimos cinco años. Estos datos están disponibles para
los trabajadores con menos de 3 años de experiencia laboral y para los de más de 3 años de
experiencia. La siguiente tabla, obtenida con Statgraphics, muestra el número de accidentes
contabilizado por la empresa (frecuencias observadas) y los resultados del análisis estadístico.
Frequency Table
Row
Exp.<3 Exp.>3 Total
---------------------------
accid_grave | 15 | 9 | 24
| 13,58 | 10,42 | 22,64%
--------------------------- Cell contents:
accid_leve | 45 | 37 | 82 Observed frequency
| 46,42 | ¦¦¦¦¦¦| 77,36% Expected frequency
---------------------------
Column 60 46 106
Total 56,60% 43,40% 100,00%
Solución: de los 60 accidentes sufridos por trabajadores con experiencia<3, 15 fueron graves, por
lo que la frecuencia relativa que se pide es: 100 · 15 / 60 = 25%
b) Calcular la frecuencia esperada de accidentes leves sufridos por trabajadores con más de 3 años
de experiencia (valor ocultado en la tabla). (2,5 puntos)
Solución: de los 82 accidentes leves, si la hipótesis nula es cierta, cabe esperar que el 56,6%
corresponda a trabajadores con experiencia<3 (82 · 0,566 = 46,42) y el 43,4% cabe esperar que
correspondan a trabajadores con experiencia>3 (82 · 0,434 = 35,58), por lo que el valor que se
pide es 35,58.
c) Calcular el p-valor sabiendo que el estadístico de contraste asociado al test chi-cuadrado vale
0,44. (2,5 puntos)
Solución: dado que p-valor > 0,05 se acepta la hipótesis nula de que el grado de experiencia es
independiente (es decir, no influye) en la gravedad del accidente. Por tanto, no hay evidencia
suficiente para afirmar que el grado de experiencia influya en la gravedad del accidente.
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 / 17
APELLIDOS, NOMBRE:_____________________________________________________
1.- Dos máquinas producen una misma pieza mecánica. La dimensión de las piezas producidas por
la máquina A sigue una distribución normal de media 8,3 mm y desviación típica 1,2 mm; la
dimensión de las piezas producidas por la máquina B sigue una distribución normal de media 8,5
mm y desviación típica 1,4 mm. El 75% de las piezas son producidas por la máquina A. Las
tolerancias de la pieza son 8,2 ± 1,6 mm. Se considera que una pieza es defectuosa cuando la
dimensión de la pieza está fuera de tolerancias. Se pide:
a) Si escogemos una pieza al azar de la producción global de la empresa, y resulta ser defectuosa,
¿cuál es la probabilidad de que la pieza haya sido producida por la máquina B? (3 puntos)
c) Si preparamos un container con 1000 piezas, ¿cuál es la probabilidad de que contenga menos de
45 piezas defectuosas? (En este apartado supondremos que la proporción de defectuosas del lote
es del 5%). (2 puntos)
d) Para aceptar o rechazar el container anterior (1000 piezas y p=0,05), el cliente examina 30
piezas al azar. Si de entre esas 30 hay cero defectuosas, se acepta el container; si hay más de 1,
se rechaza el container; pero si hay exactamente 1, se toman 30 piezas más al azar, y si del
conjunto de las 60 piezas elegidas hay al menos 2 defectuosas, se rechaza el lote, caso contrario
se acepta. Calcular :
- el número medio de piezas que se inspeccionan mediante este método de aceptación (1,5 p.)
- la probabilidad de aceptar el container. (1,5 puntos)
SOLUCIÓN:
Apartado a)
El árbol de probabilidades es
C P(6,6<=X<=9,8)=0,816
0,816
Máquina A
0,75 X=N(8,3;1,2) 0,184 D
0,736 C P(6,6<=X<=9,8)=0,736
0,25
Máquina B
X=N(8,5;1,4)
0,264 D
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 / 18
0,25·0,264
P(MáquinaB / D) = = 0,324
0,75·0,184 + 0,25·0,264
Apartado b)
Llamando a X=nº de piezas defectuosas, esta v.a. sigue una B(n=15;p). El valor de p es la
probabilidad de que una pieza escogida al azar sea defectuosa.
p = P(D) = 0,75·0,184 + 0,25·0,264 = 0,204
15 15
P( X ≥ 2) = 1 − P( X = 0) − P( X = 1) = 1 − ·0,204 0 ·(1 − 0,204 )15 − ·0,2041·(1 − 0,204 )14 = 0,842
0 1
Apartado c)
Como np>>5, Y=nº de piezas defectuosas de entre las 1000 sigue una distribución normal
Y ≡ N(np; npq ) ≡ N( 50; 50 ·0,95 ) ≡ N( 50;6,892 )
45 − 50
P(Y < 45) = P( Z ≤ ) = φ ( −0,725) = 0,234
6,892
Apartado d)
P(X=0)=0,215
0 P(X=0)=0,215
0
1
X1=B(30;0,05) P(X=1)=0,339 X2=B(30;0,05)
1 ó más
2 ó más
P(X>=2)=1-P(X=0)-P(X=1)=0,446
2.- El gasto familiar diario en alimentación en una ciudad es habitualmente una variable aleatoria
con distribución X≈N(m, 3) expresado en euros. También sabemos que el 15,9% de las familias
gasta menos de 14 € diarios. Queremos saber si la “cuesta de enero” está provocando, o no, una
reducción significativa del gasto promedio en alimentación. A lo largo de estos primeros días de
enero se ha encuestado a un total de 10 familias obteniéndose un gasto medio muestral de 16 € y
una cuasidesviación típica de 2,5 €.
a) Calcular los datos necesarios y plantear el test apropiado para la comprobación que queremos
hacer. (3 puntos)
b) ¿Cuál sería la decisión a tomar considerando un nivel de significación del 5%? (2,5 puntos)
c) Con el test planteado, ¿cuál sería β si la media del gasto fuera realmente m=15 €? (3 puntos)
d) ¿A cuántas familias habría que encuestar para que el error absoluto de la estimación, realizada a
partir de la media muestral, fuera menor que 1 € con un nivel de confianza del 99%? (1,5 puntos)
SOLUCIÓN:
14 − m
a) Necesitamos conocer la media m habitual. P[X ≤ 14] = 0,159 à φ = 0,159 .
3
Por otro lado, en tablas: φ (− 1) = 0,159 así que igualando: (14 − m ) / 3 = −1 à m=17
Las hipótesis a contrastar son:
H0 : m = m0 = 17 (habitual)
H1 : m < 17 (reducción del gasto medio)
[
c) β = P(aceptar H 0 / H1 cierta) = P( x > 15,439 / m = 15) = P N (15; 3 10 ) > 15,439 = ]
15,439 − 15
= 1 − φ = 1 − φ ( 0,46) = 0,3228
3 10
2
z ⋅ σ z0, 005 ⋅ σ
2 2
2,57 ⋅ 3
d) n ≥ α / 2 = = = 59,4 à 60 familias
e e 1