You are on page 1of 8

Comparación de k medias (ANOVA)

Suponer k muestras aleatorias de tamaño nj (j=1, 2, , k), las cuales provienen de


poblaciones normales con igual varianza.

Se define lo siguiente:

k
N  nj (N es el total de observaciones).
j 1
xi j = a la i-ésima observación de la j-ésima muestra (i=1, 2, , nj; j=1, 2, , k)

X 
 xi j , es el gran promedio, considerando el total de observaciones.
N
nj
 xi j , es el promedio de cada muestra (j=1, 2, , k).
i 1
X j 
nj
2
 k nj 
 
 
xi j
k nj k nj  , es la suma de cuadrados totales.
  xi j  X     xi j  2  
2 j 1 i 1
SCT   
j 1 i 1 j 1 i 1 N

 n j 
2   k nj 
2
    
k k 
 xi j
    xi j

 i 1 
nj  X  X      j 1 i 1 
2
SCTr  j  ,
j 1 j 1  nj  N
 

 

es la suma de cuadrados de los “tratamientos”.

k nj
SCE   xi j  X  j  2  SCT  SCTr , es la suma de cuadrados de errores.
j 1 i 1
SCTr
MCTr  , es la media de cuadrados de los “tratamientos”.
k 1
SCE
MCE  , es la media de cuadrados de errores.
N k
Las hipótesis a probar son:

H0: 1 = 2 = , k vs
H1; al menos para un par m, n se tiene que m  n .
Estadístico de prueba:

MCTr
F .
MCE

Regla de decisión:

Se rechaza H0 con un nivel de significancia de  si F  F , k 1, N k .

Donde F , k 1, N  k es el valor crítico de una variable aleatoria con distribución F tal que
P( F  F , k 1, N-k )   , (k-1) son los grados de libertad del numerador y N-k son los
grados de libertad del denominador.

La información anterior se acostumbra colocar en una tabla llamada tabla ANOVA de la


siguiente manera.

TABLA DE ANALISIS DE VARIANZA (TABLA ANOVA)

Fuente de g.l. Suma de Media de F


variación cuadrados cuadrados

Tratamientos K-1 SCTr MCTr=SCTr/(k –1) MCTr/MCE

Error N-k SCE MCE=SCE/(N – k)

Total N-1 SCT


Ejemplo. Un taller de fundición tiene 3 hornos que son usados para darle un tratamiento
a ciertas placas metálicas. Se supone que los hornos operan a la misma temperatura,
pero se desea investigar si hay alguna diferencia significativa. Se registran las
temperaturas sobre tratamientos a un grupo aleatorio de placas:

Horno 1: 491.50 498.30 498.10 493.50 493.60


Horno 2: 488.50 484.65 479.90 477.35
Horno 3: 490.10 484.80 488.25 473.00 471.85 478.65

¿Hay diferencias entre las temperaturas medias de los hornos? (usar un nivel de
significancia del 5%).

Fuente de g.l. Suma de Media de F


variación cuadrados cuadrados
Tratamientos 2
Error 12
Total 14

One-Way Analysis of Variance

Analysis of Variance on temp.


Source DF SS MS F p
Horno 2 594.5 297.3 8.62 0.005
Error 12 413.8 34.5
Total 14 1008.3

Individual 95% CIs For Mean


Based on Pooled StDev
Level N Mean StDev -+---------+---------+---------+-----
1 5 495.00 3.04 (-------*-------)
2 4 482.60 4.96 (--------*---------)
3 6 481.11 7.78 (------*-------)

-+---------+---------+---------+-----

Pooled StDev = 5.87 476.0 483.0 490.0 497.0


horno Temperatura RESI1 FITS1
1 491.50 -3.500 495.000
1 498.30 3.300 495.000
1 498.10 3.100 495.000
1 493.50 -1.500 495.000
1 493.60 -1.400 495.000
2 488.50 5.900 482.600
2 484.65 2.050 482.600
2 479.90 -2.700 482.600
2 477.35 -5.250 482.600
3 490.10 8.992 481.108
3 484.80 3.692 481.108
3 488.25 7.142 481.108
3 473.00 -8.108 481.108
3 471.85 -9.258 481.108
3 478.65 -2.458 481.108

Residual Model Diagnostics


Normal Plot of Residuals I Chart of Residuals
10 20
3.0SL=14.50
10
Residual

Residual

0 0 X=0.000

-10
-3.0SL=-14.50

-10 -20
-2 -1 0 1 2 0 5 10 15
Normal Score Observation Number

Histogram of Residuals Residuals vs. Fits


4 10

3
Frequency

Residual

2 0

0 -10
-10 -8 -6 -4 -2 0 2 4 6 8 480 485 490 495
Residual Fit
Ejemplo. Prob3/p.350 Mason et. Al.

Comparar las distancias medias de frenado en piso mojado con diferentes tipos de llantas:
A, B, C, D y E. El vehículo es acelerado a 60 mph antes de aplicar los frenos. Se realizan 10
pruebas con cada tipo de llanta.

Stopping distances (Ft) by Tire Brand.

BRAND DISTANCE
A 194.1
A 184.4
A 189
A 188.8
A 188.2
A 186.7
A 194.7
A 185.8
A 182.8
A 187.8
B 188.7
B 203.6
B 190.2
B 190.3
B 189.4
B 206.5
B 203.1
B 193.4
B 180.7
B 206.4
C 185
C 183.2
C 186
C 182.8
C 179.5
C 191.2
C 188.1
C 195.7
C 189.1
C 193.6
D 183
D 193.1
D 183.6
D 186.3
D 194.4
D 198.7
D 196.1
D 187.9
D 193.1
D 195.9
E 194.6
E 196.6
E 193.6
E 201.6
E 200.2
E 211.3
E 203.7
E 205.5
E 201.6
E 194.8

Welcome to Minitab, press F1 for help.

One-way ANOVA: DISTANCE versus BRAND

Source DF SS MS F P
BRAND 4 1147.8 286.9 7.81 0.000
Error 45 1652.4 36.7
Total 49 2800.2

S = 6.060 R-Sq = 40.99% R-Sq(adj) = 35.74%

Individual 95% CIs For Mean Based on


Pooled StDev
Level N Mean StDev ----+---------+---------+---------+-----
A 10 188.23 3.80 (------*-----)
B 10 195.23 8.97 (-----*------)
C 10 187.42 5.10 (-----*------)
D 10 191.21 5.57 (------*-----)
E 10 200.35 5.62 (------*-----)
----+---------+---------+---------+-----
186.0 192.0 198.0 204.0

Pooled StDev = 6.06


Individual Value Plot of DISTANCE vs BRAND

Individual Value Plot of DISTANCE vs BRAND


215

210

205

200
DISTANCE

195

190

185

180

A B C D E
BRAND

Boxplot of DISTANCE by BRAND

Boxplot of DISTANCE by BRAND


215

210

205

200
DISTANCE

195

190

185

180

A B C D E
BRAND
Residual Plots for DISTANCE

Residual Plots for DISTANCE


Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
99
10
90

Residual
Percent

0
50

10 -10

1
-10 0 10 190 195 200
Residual Fitted Value

Histogram of the Residuals Residuals Versus the Order of the Data


10.0
10

7.5
Frequency

Residual
0
5.0

2.5 -10

0.0
-12 -6 0 6 12 1 5 10 15 20 25 30 35 40 45 50
Residual Observation Order

You might also like