You are on page 1of 19

ETSII. Ingeniería Industrial. Métodos Estadísticos I.

12/01/10 /1

APELLIDOS, NOMBRE:_____________________________________________________

Firma: ___________________ GRUPO: _______

BLOQUE I. CUESTIONES Y PROBLEMAS TIPO TEST (90 MINUTOS)


Todas las cuestiones deben ser debidamente justificadas. Aquellas cuestiones contestadas correctamente
pero no justificadas no serán puntuadas.

1.- Circulando por autovía, la velocidad X (km/h) y el consumo de combustible Y (litros/100km) de


un cierto modelo de vehículo, podemos asumir que siguen una distribución normal bivariante de
parámetros
 110  49 cov xy  
( X , Y ) ≈ N  m =  ; V =    y ρ = 0,9
   cov 4
 6  xy 
¿A qué velocidad deberá circular para que consuma menos de 7 litros/100km en el 60% de los
casos? (2 puntos)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 /2

2.- Tres elementos electrónicos están en una placa base según una configuración de fiabilidad tal y
como se muestra en la figura de abajo.

1 2

El primer elemento sigue una distribución exponencial de media 50 horas, el segundo una
distribución normal de media 100 horas y desviación típica 20 horas, y el tercer elemento sigue una
distribución uniforme entre 10 y 200 horas. Calcular la probabilidad de que el sistema esté
funcionando al cabo de 70 horas. (2 puntos)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 /3

3.- Para estimar la media poblacional de una variable aleatoria tomamos una muestra aleatoria de
n=5 valores y utilizamos dos estimadores diferentes:
a) la media muestral de los 5 valores
b) obtenemos la media muestral de los dos primeros valores y la media muestral de los tres últimos
valores y después obtenemos el promedio de las dos medias.
Calcular la media y la varianza de ambos estimadores y decidir cuál es el mejor. (2 puntos)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 /4

4.- Consideremos un proceso de producción de resistencias para unos determinados componentes.


Se sabe que cuando el proceso funciona correctamente, la resistencia (en Ω) sigue una distribución
normal con desviación típica de 3,6 Ω. Si se toma una muestra de 4 resistencias, ¿cuál es la
probabilidad de que la cuasivarianza muestral sea superior a treinta? (2 puntos)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 /5

5.- La duración en minutos de una llamada telefónica de larga distancia, se asimila a una variable
aleatoria X cuya función de distribución es

 x 2 / 16 si [ ]
x ∈ 0, 4

F ( x) =  0 si x<0
 1 si x>4

Determinar:
a) la duración media de este tipo de llamadas telefónicas. (1 punto)
b) si una llamada lleva un minuto, probabilidad de que no pase de los 3 minutos. (1 punto)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 /6

APELLIDOS, NOMBRE:_____________________________________________________

Firma: ___________________ Profesor de prácticas: _____________

BLOQUE II. PRÁCTICAS DE ORDENADOR (45 MINUTOS)


Todas las cuestiones deben ser debidamente justificadas. Cada problema son 10 puntos. La nota del bloque
es la media de las notas de los dos problemas.

1.- En un proceso de fermentación se elabora un cierto antibiótico. La temperatura de fermentación


habitual es de 35ºC y el pH es de 7, pero los técnicos sospechan que posiblemente una temperatura
de 30ºC y un pH de 8 podrían aumentar el rendimiento del proceso, lo cual tiene gran interés. Para
estudiar esta cuestión, se lleva a cabo un diseño de experimentos con dos factores (temperatura y
pH) a dos niveles, con tres repeticiones. Los resultados obtenidos del rendimiento (medido en mg/l)
son los siguientes:

pH=7 pH=8
Temperatura 30ºC 194 186 174 190 189 194 x 30 =187,83
Temperatura 35ºC 173 179 166 182 172 177 x 35 =174,83
x pH7 =178,67 x pH8 =184

La tabla de resultados del ANOVA se muestra a continuación, en la cual se han ocultado 4 valores.
No se incluye la interacción porque ésta no es estadísticamente significativa (p-valor=0,8).
Analysis of Variance for RENDIMIENTO - Type III Sums of Squares
--------------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
--------------------------------------------------------------------------------
MAIN EFFECTS
A:Temperatura 507,0 1 ¦¦¦¦¦ ¦¦¦¦¦ 0,0059
B:pH ¦¦¦¦¦¦¦ 1 85,3333 2,17 0,1750

RESIDUAL 354,333 ¦¦ 39,3704


--------------------------------------------------------------------------------
TOTAL (CORRECTED) 946,667 11
--------------------------------------------------------------------------------

a) Calcular el valor de la F-ratio asociada al factor temperatura. (2 puntos)

b) Dado que el p-valor asociado a pH es mayor que 0,05 puede considerarse que el pH no ejerce un
efecto estadísticamente significativo en el rendimiento (asumiendo α=0,05). Justificar cómo se
podría llegar a la misma conclusión a partir de los datos de la tabla si no se conociera el p-valor.
(2 puntos)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 /7

c) Teniendo en cuenta los resultados del ANOVA y considerando un nivel de significación del 5%,
¿qué temperatura y qué pH deberá utilizarse para maximizar el rendimiento del proceso?
(2 puntos)

d) Con los 12 valores de rendimiento se ha realizado un análisis de regresión lineal múltiple en


función de las variables temperatura y pH, obteniéndose los resultados indicados a continuación.
Multiple Regression Analysis
-----------------------------------------------------------------------------
Dependent variable: RENDIMIENTO
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
CONSTANT 225,833 35,9992 6,27329 0,0001
Temperatura -2,6 0,724526 -3,58855 0,0059
pH 5,33333 3,62263 1,47223 0,1750
-----------------------------------------------------------------------------

R-squared = 62,5704 percent


R-squared (adjusted for d.f.) = 54,2527 percent
Standard Error of Est. = 6,27458
Mean absolute error = 4,22222

Indicar si las siguientes afirmaciones son verdaderas o falsas, justificando convenientemente la


respuesta:

- En este caso el ANOVA es preferible al análisis de regresión ya que permite estudiar si hay
interacción entre los dos factores, lo cual no puede estudiarse con regresión. (2 puntos)

- La tabla de resultados de la regresión sugiere que si el pH aumenta una unidad, el rendimiento


aumentará en promedio en 5,333 unidades si la temperatura permanece constante. (2 puntos)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 /8

2.- Una mediana empresa constructora ha contabilizado el número de accidentes leves y graves de
sus trabajadores que se han producido en los últimos cinco años. Estos datos están disponibles para
los trabajadores con menos de 3 años de experiencia laboral y para los de más de 3 años de
experiencia. La siguiente tabla, obtenida con Statgraphics, muestra el número de accidentes
contabilizado por la empresa (frecuencias observadas) y los resultados del análisis estadístico.
Frequency Table
Row
Exp.<3 Exp.>3 Total
---------------------------
accid_grave | 15 | 9 | 24
| 13,58 | 10,42 | 22,64%
--------------------------- Cell contents:
accid_leve | 45 | 37 | 82 Observed frequency
| 46,42 | ¦¦¦¦¦¦| 77,36% Expected frequency
---------------------------
Column 60 46 106
Total 56,60% 43,40% 100,00%

Responder a las siguientes preguntas, justificando convenientemente la respuesta:

a) Calcular la frecuencia relativa de accidentes graves condicionada a los trabajadores de menos de


3 años de experiencia. (2,5 punto)

b) Calcular la frecuencia esperada de accidentes leves sufridos por trabajadores con más de 3 años
de experiencia (valor ocultado en la tabla). (2,5 puntos)

c) Calcular el p-valor sabiendo que el estadístico de contraste asociado al test chi-cuadrado vale
0,44. (2,5 puntos)

d) Teniendo en cuenta el p-valor calculado en el apartado anterior y considerando un riesgo de


primera especie del 5%, ¿hay evidencia suficiente para afirmar que el grado de experiencia
laboral influye en la gravedad del accidente? (2,5 puntos)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 /9

APELLIDOS, NOMBRE:_____________________________________________________

Firma: ___________________ GRUPO: _______

BLOQUE III. PROBLEMAS (90 MINUTOS)


Cada problema vale 10 puntos. La nota del bloque es la media de las notas de los dos problemas.

1.- Dos máquinas producen una misma pieza mecánica. La dimensión de las piezas producidas por
la máquina A sigue una distribución normal de media 8,3 mm y desviación típica 1,2 mm; la
dimensión de las piezas producidas por la máquina B sigue una distribución normal de media 8,5
mm y desviación típica 1,4 mm. El 75% de las piezas son producidas por la máquina A. Las
tolerancias de la pieza son 8,2 ± 1,6 mm. Se considera que una pieza es defectuosa cuando la
dimensión de la pieza está fuera de tolerancias. Se pide:

a) Si escogemos una pieza al azar de la producción global de la empresa, y resulta ser defectuosa,
¿cuál es la probabilidad de que la pieza haya sido producida por la máquina B? (3 puntos)

b) Si escogemos 15 piezas al azar de la producción global, ¿cuál es la probabilidad de que haya al


menos dos defectuosas? (2 puntos)

c) Si preparamos un container con 1000 piezas, ¿cuál es la probabilidad de que contenga menos de
45 piezas defectuosas? (En este apartado supondremos que la proporción de defectuosas del lote
es del 5%). (2 puntos)

d) Para aceptar o rechazar el container anterior (1000 piezas y p=0,05), el cliente examina 30
piezas al azar. Si de entre esas 30 hay cero defectuosas, se acepta el container; si hay más de 1,
se rechaza el container; pero si hay exactamente 1, se toman 30 piezas más al azar, y si del
conjunto de las 60 piezas elegidas hay al menos 2 defectuosas, se rechaza el lote, caso contrario
se acepta. Calcular :
- el número medio de piezas que se inspeccionan mediante este método de aceptación (1,5 p.)
- la probabilidad de aceptar el container. (1,5 puntos)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 / 10

2.- El gasto familiar diario en alimentación en una ciudad es habitualmente una variable aleatoria
con distribución X≈N(m, 3) expresado en euros. También sabemos que el 15,9% de las familias
gasta menos de 14 € diarios. Queremos saber si la “cuesta de enero” está provocando, o no, una
reducción significativa del gasto promedio en alimentación. A lo largo de estos primeros días de
enero se ha encuestado a un total de 10 familias obteniéndose un gasto medio muestral de 16 € y
una cuasidesviación típica de 2,5 €.

a) Calcular los datos necesarios y plantear el test apropiado para la comprobación que queremos
hacer. (3 puntos)

b) ¿Cuál sería la decisión a tomar considerando un nivel de significación del 5%? (2,5 puntos)

c) Con el test planteado, ¿cuál sería β si la media del gasto fuera realmente m=15 €? (3 puntos)

d) ¿A cuántas familias habría que encuestar para que el error absoluto de la estimación, realizada a
partir de la media muestral, fuera menor que 1 € con un nivel de confianza del 99%? (1,5 puntos)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 / 11

APELLIDOS, NOMBRE:_____________________________________________________

Firma: ___________________ GRUPO: _______

BLOQUE I. CUESTIONES Y PROBLEMAS TIPO TEST (90 MINUTOS)


Todas las cuestiones deben ser debidamente justificadas. Aquellas cuestiones contestadas correctamente
pero no justificadas no serán puntuadas.

1.- Circulando por autovía, la velocidad X (km/h) y el consumo de combustible Y (litros/100km) de


un cierto modelo de vehículo, podemos asumir que siguen una distribución normal bivariante de
parámetros
 110  49 cov xy  
( X , Y ) ≈ N  m =  ; V =    y ρ = 0,9
   cov 4
 6  xy 
¿A qué velocidad deberá circular para que consuma menos de 7 litros/100km en el 60% de los
casos? (2 puntos)

SOLUCIÓN:
σ c2 = σ 2y ⋅ (1 − ρ 2 ) = 4 ⋅ (1 − 0,92 ) = 0,76 à σ c = 0,87

[ ]  7 − mc 
P(Yc < 7) = 0,60 ; P N ( mc , 0,87) < 7 = 0,6 ; φ   = 0,6 ; φ (0, 255) = 0,6 ;
7 − mc
= 0,255
 0,87  0,87
σ 2
mc = 6,78 ; mc = my + ρ y ( x − mx ) ; m c = 6,78 = 6 + 0,9 ( x0 − 110) à x0 = 113,03 km/h
σx 7

2.- Tres elementos electrónicos están en una placa base según una configuración de fiabilidad tal y
como se muestra en la figura de abajo.

1 2

El primer elemento sigue una distribución exponencial de media 50 horas, el segundo una
distribución normal de media 100 horas y desviación típica 20 horas, y el tercer elemento sigue una
distribución uniforme entre 10 y 200 horas. Calcular la probabilidad de que el sistema esté
funcionando al cabo de 70 horas. (2 puntos)
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 / 12

SOLUCIÓN:
1
x1 ≡ EXP ( λ = )
50
x 2 ≡ N(100 ;20 )

X3 ≡ U[10;200 ]

Calculamos la probabilidad de que cada la duración uno de estos componentes sea superior a 70
horas.
70

P( X1 ≥ 70 ) = e −λ·x = e 50 = 0,247

 70 − 100 
P( X2 ≥ 70 ) = 1 − P( X 2 ≤ 70 ) = 1 − φ  = 1 − φ( −1,5) = 1 − 0,067 = 0,933
 20 
70 − 10
P( X3 ≥ 70 ) = 1 − P( X 3 ≤ 70 ) = 1 − Fx ( 70 ) = 1 − = 0,684
200 − 10
Llamando a Ri la probabilidad de que el componente i dure más de 70 horas. La probabilidad de
que el sistema funcione al cabo de 70 horas es,

Rsys = 1 − (1 − R3 )·(1 − R1R 2 ) = 1 − (1 − 0,684)·(1 − 0.247·0,933) = 0,757

3.- Para estimar la media poblacional de una variable aleatoria tomamos una muestra aleatoria de
n=5 valores y utilizamos dos estimadores diferentes:
a) la media muestral de los 5 valores
b) obtenemos la media muestral de los dos primeros valores y la media muestral de los tres últimos
valores y después obtenemos el promedio de las dos medias.

Calcular la media y la varianza de ambos estimadores y decidir cuál es el mejor. (2 puntos)

SOLUCIÓN:
Σx
a) x = i = 1 2
n
x + x + x3 + x4 + x5
5
()
à E x =m ; σ2 x = () σ 2 σ2
n
=
5
= 0,2σ 2

x1 + x2 x3 + x4 + x5
+ x + x2 x3 + x 4 + x5
b) θ = 2 3 = 1 +
2 4 6
E (θ ) = [E ( x1 ) + E ( x2 )] + [E( x3 ) + E ( x4 ) + E( x5 )] =
1 1 2m 3m
+ =m
4 6 4 6
D 2 (θ ) =
1 2
16
[
D ( x1 ) + D 2 ( x2 ) +] 1
36
[
D 2 ( x3 ) + D 2 ( x4 ) + D 2 ( x5 ) = ]
1 1 1 1
= 2σ 2 + 3σ 2 = σ 2 + σ 2 = 0, 2083σ 2
16 36 8 12
Tiene menor varianza la media de los 5 valores.
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 / 13

4.- Consideremos un proceso de producción de resistencias para unos determinados componentes.


Se sabe que cuando el proceso funciona correctamente, la resistencia (en Ω) sigue una distribución
normal con desviación típica de 3,6 Ω. Si se toma una muestra de 4 resistencias, ¿cuál es la
probabilidad de que la cuasivarianza muestral sea superior a treinta? (2 puntos)

SOLUCIÓN:
 n −1 n − 1  30 ⋅ 3 
( )
P s '2 > 30 = P 2 s '2 > 30 2  = P χ32 > 2 
(
= P χ 32 > 6,944 = 0,074)
 σ σ   3,6 

5.- La duración en minutos de una llamada telefónica de larga distancia, se asimila a una variable
aleatoria X cuya función de distribución es

 x 2 / 16 si [ ]
x ∈ 0, 4

F ( x) =  0 si x<0
 1 si x>4

Determinar:
a) la duración media de este tipo de llamadas telefónicas. (1 punto)
b) si una llamada lleva un minuto, probabilidad de que no pase de los 3 minutos. (1 punto)

SOLUCIÓN:
4
dF ( x) x +∞ 4 x  x3  43 8
a) f ( x ) = = ; E ( x ) = ∫ x ⋅ f ( x ) dx = ∫ x ⋅ dx =   = =
−∞
dx 8 0 8  24  0 24 3
x
[ ]
3

P[( x > 1) ∩ ( x < 3) ] ∫1 8


dx x 2 / 16 3 8 / 16 8
b) P( x < 3 / x > 1) = = = 1
= =
P ( x > 1) 4 x
[ 2
∫1 8 dx x /16 1
4
]15 / 16 15
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 / 14

APELLIDOS, NOMBRE:_____________________________________________________

Firma: ___________________ Profesor de prácticas: _____________

BLOQUE II. PRÁCTICAS DE ORDENADOR (45 MINUTOS)


Todas las cuestiones deben ser debidamente justificadas. Cada problema son 10 puntos. La nota del bloque
es la media de las notas de los dos problemas.

1.- En un proceso de fermentación se elabora un cierto antibiótico. La temperatura de fermentación


habitual es de 35ºC y el pH es de 7, pero los técnicos sospechan que posiblemente una temperatura
de 30ºC y un pH de 8 podrían aumentar el rendimiento del proceso, lo cual tiene gran interés. Para
estudiar esta cuestión, se lleva a cabo un diseño de experimentos con dos factores (temperatura y
pH) a dos niveles, con tres repeticiones. Los resultados obtenidos del rendimiento (medido en mg/l)
son los siguientes:

pH=7 pH=8
Temperatura 30ºC 194 186 174 190 189 194 x 30 =187,83
Temperatura 35ºC 173 179 166 182 172 177 x 35 =174,83
x pH7 =178,67 x pH8 =184

La tabla de resultados del ANOVA se muestra a continuación, en la cual se han ocultado 4 valores.
No se incluye la interacción porque ésta no es estadísticamente significativa (p-valor=0,8).
Analysis of Variance for RENDIMIENTO - Type III Sums of Squares
--------------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
--------------------------------------------------------------------------------
MAIN EFFECTS
A:Temperatura 507,0 1 ¦¦¦¦¦ ¦¦¦¦¦ 0,0059
B:pH ¦¦¦¦¦¦¦ 1 85,3333 2,17 0,1750

RESIDUAL 354,333 ¦¦ 39,3704


--------------------------------------------------------------------------------
TOTAL (CORRECTED) 946,667 11
--------------------------------------------------------------------------------

a) Calcular el valor de la F-ratio asociada al factor temperatura. (2 puntos)

CM temp SC / gr.lib .temp 507 / 1


Solución: F-ratio = = temp = = 12,88
CM residual CMresid 39,37

b) Dado que el p-valor asociado a pH es mayor que 0,05 puede considerarse que el pH no ejerce un
efecto estadísticamente significativo en el rendimiento (asumiendo α=0,05). Justificar cómo se
podría llegar a la misma conclusión a partir de los datos de la tabla si no se conociera el p-valor.
(2 puntos)

Solución: Grados de libertad residuales = gr.lib.totales – gr.lib.temp – gr.lib.pH = 11 – 1 – 1 = 9


Si H0 es cierta, F-ratio asociada a pH sigue una distribución F1;9 (un grado de libertad en el
numerador y 9 en el denominador que son los grados de libertad residuales). Según tablas, el valor
crítico F10;9, 05 = 5,12 . Como F-ratio=2,17 es inferior al valor crítico, se acepta H0 .
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 / 15

c) Teniendo en cuenta los resultados del ANOVA y considerando un nivel de significación del 5%,
¿qué temperatura y qué pH deberá utilizarse para maximizar el rendimiento del proceso?
(2 puntos)

Solución: como el factor pH no es estadísticamente significativo (p-valor>0,05), da lo mismo


utilizar cualquiera de los dos valores de pH. El efecto de la temperatura resulta significativo (p-
valor<0,05), por lo que la media poblacional del rendimiento obtenido a 30ºC será distinto que a
35ºC. Interesará utilizar 30ºC ya que, como se deduce de la tabla, a esta temperatura el
rendimiento obtenido es mayor.

d) Con los 12 valores de rendimiento se ha realizado un análisis de regresión lineal múltiple en


función de las variables temperatura y pH, obteniéndose los resultados indicados a continuación.
Multiple Regression Analysis
-----------------------------------------------------------------------------
Dependent variable: RENDIMIENTO
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
CONSTANT 225,833 35,9992 6,27329 0,0001
Temperatura -2,6 0,724526 -3,58855 0,0059
pH 5,33333 3,62263 1,47223 0,1750
-----------------------------------------------------------------------------

R-squared = 62,5704 percent


R-squared (adjusted for d.f.) = 54,2527 percent
Standard Error of Est. = 6,27458
Mean absolute error = 4,22222

Indicar si las siguientes afirmaciones son verdaderas o falsas, justificando convenientemente la


respuesta:

- En este caso el ANOVA es preferible al análisis de regresión ya que permite estudiar si hay
interacción entre los dos factores, lo cual no puede estudiarse con regresión. (2 puntos)

Falso, ya que con regresión también es posible estudiar el efecto de la interacción. En este caso las
dos técnicas son equivalentes al tratarse de dos factores cuantitativos a dos niveles, y por esa razón
el p-valor de temperatura y pH es el mismo con ambas técnicas.

- La tabla de resultados de la regresión sugiere que si el pH aumenta una unidad, el rendimiento


aumentará en promedio en 5,333 unidades si la temperatura permanece constante. (2 puntos)

Falso, pues el factor pH no es significativo, lo cual implica que si el pH aumenta una unidad, el
rendimiento no aumentará en promedio.
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 / 16

2.- Una mediana empresa constructora ha contabilizado el número de accidentes leves y graves de
sus trabajadores que se han producido en los últimos cinco años. Estos datos están disponibles para
los trabajadores con menos de 3 años de experiencia laboral y para los de más de 3 años de
experiencia. La siguiente tabla, obtenida con Statgraphics, muestra el número de accidentes
contabilizado por la empresa (frecuencias observadas) y los resultados del análisis estadístico.
Frequency Table
Row
Exp.<3 Exp.>3 Total
---------------------------
accid_grave | 15 | 9 | 24
| 13,58 | 10,42 | 22,64%
--------------------------- Cell contents:
accid_leve | 45 | 37 | 82 Observed frequency
| 46,42 | ¦¦¦¦¦¦| 77,36% Expected frequency
---------------------------
Column 60 46 106
Total 56,60% 43,40% 100,00%

Responder a las siguientes preguntas, justificando convenientemente la respuesta:

a) Calcular la frecuencia relativa de accidentes graves condicionada a los trabajadores de menos de


3 años de experiencia. (2,5 punto)

Solución: de los 60 accidentes sufridos por trabajadores con experiencia<3, 15 fueron graves, por
lo que la frecuencia relativa que se pide es: 100 · 15 / 60 = 25%

b) Calcular la frecuencia esperada de accidentes leves sufridos por trabajadores con más de 3 años
de experiencia (valor ocultado en la tabla). (2,5 puntos)

Solución: de los 82 accidentes leves, si la hipótesis nula es cierta, cabe esperar que el 56,6%
corresponda a trabajadores con experiencia<3 (82 · 0,566 = 46,42) y el 43,4% cabe esperar que
correspondan a trabajadores con experiencia>3 (82 · 0,434 = 35,58), por lo que el valor que se
pide es 35,58.

c) Calcular el p-valor sabiendo que el estadístico de contraste asociado al test chi-cuadrado vale
0,44. (2,5 puntos)

Solución: el estadístico de contraste seguirá una distribución chi-cuadrado cuyos grados de


libertad son: χ(2h −1)( k −1) = χ(22 −1)( 2−1) = χ12 de modo que: p-valor = P( χ12 > 0, 44) =0,5

d) Teniendo en cuenta el p-valor calculado en el apartado anterior y considerando un riesgo de


primera especie del 5%, ¿hay evidencia suficiente para afirmar que el grado de experiencia
laboral influye en la gravedad del accidente? (2,5 puntos)

Solución: dado que p-valor > 0,05 se acepta la hipótesis nula de que el grado de experiencia es
independiente (es decir, no influye) en la gravedad del accidente. Por tanto, no hay evidencia
suficiente para afirmar que el grado de experiencia influya en la gravedad del accidente.
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 / 17

APELLIDOS, NOMBRE:_____________________________________________________

Firma: ___________________ GRUPO: _______

BLOQUE III. PROBLEMAS (90 MINUTOS)


Cada problema vale 10 puntos. La nota del bloque es la media de las notas de los dos problemas.

1.- Dos máquinas producen una misma pieza mecánica. La dimensión de las piezas producidas por
la máquina A sigue una distribución normal de media 8,3 mm y desviación típica 1,2 mm; la
dimensión de las piezas producidas por la máquina B sigue una distribución normal de media 8,5
mm y desviación típica 1,4 mm. El 75% de las piezas son producidas por la máquina A. Las
tolerancias de la pieza son 8,2 ± 1,6 mm. Se considera que una pieza es defectuosa cuando la
dimensión de la pieza está fuera de tolerancias. Se pide:

a) Si escogemos una pieza al azar de la producción global de la empresa, y resulta ser defectuosa,
¿cuál es la probabilidad de que la pieza haya sido producida por la máquina B? (3 puntos)

b) Si escogemos 15 piezas al azar de la producción global, ¿cuál es la probabilidad de que haya al


menos dos defectuosas? (2 puntos)

c) Si preparamos un container con 1000 piezas, ¿cuál es la probabilidad de que contenga menos de
45 piezas defectuosas? (En este apartado supondremos que la proporción de defectuosas del lote
es del 5%). (2 puntos)

d) Para aceptar o rechazar el container anterior (1000 piezas y p=0,05), el cliente examina 30
piezas al azar. Si de entre esas 30 hay cero defectuosas, se acepta el container; si hay más de 1,
se rechaza el container; pero si hay exactamente 1, se toman 30 piezas más al azar, y si del
conjunto de las 60 piezas elegidas hay al menos 2 defectuosas, se rechaza el lote, caso contrario
se acepta. Calcular :
- el número medio de piezas que se inspeccionan mediante este método de aceptación (1,5 p.)
- la probabilidad de aceptar el container. (1,5 puntos)

SOLUCIÓN:
Apartado a)
El árbol de probabilidades es
C P(6,6<=X<=9,8)=0,816
0,816

Máquina A
0,75 X=N(8,3;1,2) 0,184 D

0,736 C P(6,6<=X<=9,8)=0,736
0,25
Máquina B
X=N(8,5;1,4)

0,264 D
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 / 18

0,25·0,264
P(MáquinaB / D) = = 0,324
0,75·0,184 + 0,25·0,264

Apartado b)
Llamando a X=nº de piezas defectuosas, esta v.a. sigue una B(n=15;p). El valor de p es la
probabilidad de que una pieza escogida al azar sea defectuosa.
p = P(D) = 0,75·0,184 + 0,25·0,264 = 0,204

15  15 
P( X ≥ 2) = 1 − P( X = 0) − P( X = 1) = 1 −  ·0,204 0 ·(1 − 0,204 )15 −  ·0,2041·(1 − 0,204 )14 = 0,842
0 1

Apartado c)
Como np>>5, Y=nº de piezas defectuosas de entre las 1000 sigue una distribución normal
Y ≡ N(np; npq ) ≡ N( 50; 50 ·0,95 ) ≡ N( 50;6,892 )

45 − 50
P(Y < 45) = P( Z ≤ ) = φ ( −0,725) = 0,234
6,892

Apartado d)
P(X=0)=0,215
0 P(X=0)=0,215
0

1
X1=B(30;0,05) P(X=1)=0,339 X2=B(30;0,05)

1 ó más
2 ó más
P(X>=2)=1-P(X=0)-P(X=1)=0,446

El valor medio del número de piezas muestreadas es,


E( n) = 30·0,215 + 60·0,339 + 30·0,446 = 40,17

La probabilidad de aceptar el container es,


Pa = P( X1 = 0) + P( X1 = 1)·P( X2 = 0) = 0,215 + 0,339 ·0,215 = 0,288
ETSII. Ingeniería Industrial. Métodos Estadísticos I. 12/01/10 / 19

2.- El gasto familiar diario en alimentación en una ciudad es habitualmente una variable aleatoria
con distribución X≈N(m, 3) expresado en euros. También sabemos que el 15,9% de las familias
gasta menos de 14 € diarios. Queremos saber si la “cuesta de enero” está provocando, o no, una
reducción significativa del gasto promedio en alimentación. A lo largo de estos primeros días de
enero se ha encuestado a un total de 10 familias obteniéndose un gasto medio muestral de 16 € y
una cuasidesviación típica de 2,5 €.

a) Calcular los datos necesarios y plantear el test apropiado para la comprobación que queremos
hacer. (3 puntos)

b) ¿Cuál sería la decisión a tomar considerando un nivel de significación del 5%? (2,5 puntos)

c) Con el test planteado, ¿cuál sería β si la media del gasto fuera realmente m=15 €? (3 puntos)

d) ¿A cuántas familias habría que encuestar para que el error absoluto de la estimación, realizada a
partir de la media muestral, fuera menor que 1 € con un nivel de confianza del 99%? (1,5 puntos)

SOLUCIÓN:
14 − m 
a) Necesitamos conocer la media m habitual. P[X ≤ 14] = 0,159 à φ   = 0,159 .
 3 
Por otro lado, en tablas: φ (− 1) = 0,159 así que igualando: (14 − m ) / 3 = −1 à m=17
Las hipótesis a contrastar son:
H0 : m = m0 = 17 (habitual)
H1 : m < 17 (reducción del gasto medio)

b) Cuando σ es conocida (σ=3) se acepta H0 si:


σ σ 3
x > m0 − zα ⋅ = 17 − z0, 05 = 17 − 1,645 = 15,439
n n 10
Como sabemos, x =16 > 15,439 podemos aceptar H0 y concluir que la “cuesta de enero” no
produce una reducción significativa del gasto medio.

[
c) β = P(aceptar H 0 / H1 cierta) = P( x > 15,439 / m = 15) = P N (15; 3 10 ) > 15,439 = ]
 15,439 − 15 
= 1 − φ   = 1 − φ ( 0,46) = 0,3228
 3 10 
2
 z ⋅ σ   z0, 005 ⋅ σ
2 2
  2,57 ⋅ 3 
d) n ≥  α / 2  =   =   = 59,4 à 60 familias
 e   e   1 

You might also like