Professional Documents
Culture Documents
Agenda
Characteristiques de lAnalyse de la Variance
Mthode Gnrale
Le modle
Les suppositions du modle
Test du supposition
La somme des carres
Calcul du test statistique
Exercise
Le carre d Epsilon
Example
Jan-16
Fethi Derbeli
Hypothesis Testing
Non Normal
Ho: s1 = s2 = s3 = ...
Ha: at least one is different
Minitab:
Stat - Anova Test for Equal Variances
For only two ss this is similar to an FTest: F=(S1)2 / (S2)2
If F calc > F table, then reject null.
(Use Chi-Squared for one sample)
Normality Test
Contingency
Table
Normal
Two or More
Samples
Levenes Test
Ho: M1 = M target
Ha: M1 M target
1 Sample
Minitab:
Stat - Nonparametric - 1 Sample-Sign (OR)
Stat - Nonparametric - 1 Sample-Wilcoxon
(This is also used for paired comparisons:
Ho: M1 - M2 = 0)
M1 = Median of sample 1
M target = Target Median
One
Ho: s1 = s target
Sample
Ha: s 1 s target
Minitab:
Chi-Squared
Stat Basic Stats Display Descriptive
Statistics
Graphs: Graphical Summary
If s target falls with s CI, then fail to
Two or More
Samples
Ho: s 1 = s 2 = s 3 = ...
Ha: at leastone is different
Minitab:
Stat - Anova Test for Equal Variance
(For only two ss this is the same as an FTest: F=(S1)2 / (S2)2
If F calc > F table, then reject null.
Bartletts Test
reject Ho.
Ho: 1 = target
Ha: 1 target
1
Minitab:
Stat - Basic Stats - 1 Sample-T
Sample T Test
Two
Samples
Two or More
Samples
One Way
Anova
2 or More
Ho: M1 = M2 = M3 = ...
Samples
Ha: at least one is different
Minitab:
Stat - Nonparametric - Mann-Whitney (OR)
Stat - Nonparametric - Kruskal-Wallis (OR)
Stat - Nonparametric - Moods Median (OR)
Stat - Nonparametric - Friedmans
M1 = Median of sample 1, etc...
Jan-16
Ho: 1 = 2
2 Sample T Test
( Variances Equal)
Ha: 1 2
Minitab:
Stat - Basic Stats - 2-Sample T
(Compares Means using pooled Std Dev)
Assume equal variances
Ho: 1 = 2
2 Sample T Test
(Variances Not Equal)
Ha: 1 2
Minitab:
Stat - Basic Stats - 2-Sample T
(Compares Means using each sample Std Dev)
Fethi Derbeli
Ho: 1 = 2 = 3 = ...
Ha: at least one is different
Minitab:
Stat - Anova- One-way (or
one-way unstacked)
Assumes Equal Variances
(Bartletts test must fail to
reject that variances are =.
Analyse de la Variance
LAnalyse de Variance est un outil utilis pour dtecter sil
existe une diffrence statistique ( ou s) entre plusieurs
facteurs et si cette diffrence est attribue au hasard ou une
cause spcifique (les paramtres viennent de mme population
ou non.)
Cet outil utilise les statistiques pour dterminer si la variation
dans un facteur est suprieure ou infrieure la variation entre
les facteurs. Si la variation entre les facteurs est suprieure la
variation entre les niveaux de facteurs, alors on dit que le
facteur est significatif
Les outputs sont gnrallement mesures sous forme
dintervalle/Echelle (Rendement, temprature, voltes, %
impurits, etc)
Les inputs ou facteurs sont des donnes catgoriques.
On veut rpondre la question:
Existe t il une diffrence significative entre _____&____&___?
Jan-16
Fethi Derbeli
Mthode ANOVA
Step 1: Statuer le problme pratique (Graph data)
Step 2: Statuer lhypothse nulle et alternative
Step 3: Choisir le test statistique appropri ANOVA
Les moyennes sont indpendantes et normalement distribus
Les variances sont gaux pour tous les facteurs
Fethi Derbeli
Step 2 & 3:
H 0 : s pop1 = s pop2 = s pop3 = s pop4 = ...
H a : au moins un est diffrent
Les variances des populations sont gales tous les niveaux des facteurs (test
dgalit des variances)
Stat > ANOVA > Test for Equal Variances
Fethi Derbeli
SS
df
MS
Test Statistic
Factor
SSfactor
g-1
MSfactor= SSfactor/(g-1)
F= MSfactor/ MSerror
Error
SSerror
g(n-1)
MSerror= SSerror/[g(n-1)]
Total
SStotal
ng-1
2
2
2
(
x
x
)
=
(
x
x
)
(
x
x
)
ij
j
ij j
j =1 i =1
j =1
SStotal
j =1 i =1
SSfactor
Where:
g = nombre des
sousgroupes
n = nomber des
chantillons par fateurr
SSerror
Entre- Groupe
Variation
(SSfactor)
Total
Variation
(SStotal)
Jan-16
Dans le Groupe
Variation
(SSerror)
Fethi Derbeli
Steps 8-10
Step 8: Interpreter le p-value (ou le F-statistic) pour leffet des
facteurs
P-value < .05, rejeterHo
Autrement assumer que lhypthse nulle est vrai.
Calculer le carre depsilon des facteurs et lerreur
2
factor
SS Between
=
SSTotal
2
error
=
SSError
SSTotal
Fethi Derbeli
Site 2
15.7
16.6
16.5
16
15.7
16.4
16.7
16.8
16.3
16.5
Site 3
17.3
17.2
17.4
17.2
17
17.6
17.4
17.3
16.5
16.7
Site 4
15.2
14.8
14.3
14.9
15.4
14.9
14.6
15.1
15
14.7
Fethi Derbeli
Il semble que la
productivit de
cas par heure soit
la plus leve au
site 3.
Cases / Hour
Cas/heure
17
16
Comment
pouvons-nous en
tre srs ?
15
Site
Fethi Derbeli
10
Variations
Variations dues
lexprience
SS Total = SS
+ SS Erreur
Niveau facteur
2 k
= +
_ 2
(yij yi)
n*(yi-y) (yij-=y)2 = i
=1
i = 1j = 1
i=1 j=1
O:
y = la moyenne globale
yij = la jme observation dans le ime chantillon
n = le nombre dobservations par groupe (8 ou 10)
k = le nombre de niveaux de facteurs (4)
Jan-16
Fethi Derbeli
11
Test de Bartlett
Donnes normales
Niveaux de facteurs
Factor Levels
Ho: s1 = s2 = s3 = ...
Ha: au moins une diffre
Bartlett's Test
Test Statistic: 4.646
P-Value
: 0.200
Levene's Test
Test Statistic: 2.326
P-Value
0.0
0.5
1.0
1.5
: 0.092
La valeur-P doit
tre > 0.05 pour quon
ne rejette pas Ho.
Test de Levene
Donnes non normales
Ho: s1 = s2 = s3 = ...
Ha: au moins une diffre
La valeur-P doit
tre > 0.05 pour quon
ne rejette pas Ho.
Pour que les rsultats dANOVA soient valables, il faut que les variances soient gales
Jan-16
Fethi Derbeli
12
Cas/heure
Cases Per Hour
17.5
16.5
Moyenne globale
=15.97
15.5
14.5
1
Site
Site 1
15.41
Jan-16
Site 2
16.32
Site 3
17.16
Site 4
14.89
Fethi Derbeli
=
y1 - y
__
=
y2 - y
_
=
y3 - y
_
=
y4 - y
= 15.413-15.974 = -0.561
= 16.320-15.974 = 0.346
= 17.160 -15.974 = 1.186
= 14.890-15.974 = -1.084
_ =
Les termes derreur, ou valeurs rsiduelles
( yij - yi ) sont calculs comme suit
_
y11 - y1 = 14.9 - 15.413 = -0.513
Jan-16
Fethi Derbeli
14
Jan-16
Moyenne globale
-0.561
0.346
1.186
-1.084
-0.513
0.287
-0.213
0.388
-0.313
0.888
-1.012
0.488
-0.62
0.28
0.18
-0.32
-0.62
0.08
0.38
0.48
-0.02
0.18
0.14
0.04
0.24
0.04
-0.16
0.44
0.24
0.14
-0.66
-0.46
0.31
-0.09
-0.59
0.01
0.51
0.01
-0.29
0.21
0.11
-0.19
Fethi Derbeli
15
Variations
SS
k
=
Total
=2
= SS
Niveau facteurs
35.534
Jan-16
+ SS
Erreur
_ =2 k n
2
_
=
n*(yi y) +
(yij yi)
i=1
i = 1j = 1
(yij-y)
i=1 j=1
Variations dues
lexprience
29.536
Fethi Derbeli
5.998
16
MS Niveau facteur
MS Erreur
Jan-16
29.536
SS niveau facteur _______
____________
=
= 4-1
= 9.845
k-1
SS Erreur
= ________
n-k
5.998
= ______
38 - 4
Fethi Derbeli
= 0.176
17
Fethi Derbeli
18
Fethi Derbeli
19
Sources de
variabilit
Jan-16
Mesure
quantitative
de la
variabilit
explique
Quantit
par chaque
dinformation
source
Degrs de
libert
Estimation
des variances La mesure
statistique
utilise
pour
dterminer
si un
facteur est
significatif
Fethi Derbeli
P
0.000
Erreur de
Type I
(valeur-P)
20
Exemple Step 1
Problme practique: Les data
rcents pour un mlange de
production montrent un taux de
brlure plus faibles que les
anciennes Lingenieur de
production croit que le problme
vient dun oxydant de nitramine.
Un prlevement sur 17 mlange
venant de 3 lots de nitramine. Il
veut savoir si le taux de brlure est
impact par les lots.
Jan-16
Fethi Derbeli
Fn: Oxidizer.mtw
Lot 1
Lot 2
Lot 3
0.526
0.522
0.457
0.532
0.535
0.507
0.514
0.515
0.464
0.501
0.555
0.475
0.511
0.481
0.471
0.506
0.444
21
Step 1 (cont)
Cest conseille de visualiser les data sous formes
graphique
Graph > Plot
Stat > ANOVA > Main Effects Plot
Main Effects Plot - Data Means for Burning Rate
0.534
0.55
Burning Rate
Burning Rate
0.524
0.50
0.514
0.504
0.494
0.484
0.45
0.474
Lot
Jan-16
Lot
Fethi Derbeli
22
Exemple Step 2
Statuer lhypothse nulle et alternative
Jan-16
Fethi Derbeli
23
Exemple Step 3
Est ce que ANOVA est le test appropri?
Les moyennes doivent tre indpendantes et normalement distribues
Stat > Basic Stats > Normality Test (each individual data set)
Lgalit des variances est vrai pour tous les facteurs
Stat > ANOVA > Test for Equal Variances (use stacked data)
Factor Levels
Lot 1
.999
Bartlett's Test
.99
Probability
.95
P-Value
.80
: 0.530
.50
Lot 2
.20
.05
Levene's Test
.01
.001
P-Value
0.45
0.50
0.55
Lot 3
Burning Rate
Average: 0.500897
StDev: 0.0309233
N: 17
Jan-16
: 0.739
0.00
Fethi Derbeli
0.05
0.10
24
Note:
Le Fit est la moyenne de chaque lot
Le Residual est (valeur observ
la moyenne)
Jan-16
Fethi Derbeli
25
Exemple Step 7
One-way ANOVA: Burning Rate versus Lot
DF
SS
MS
0.006775
0.003387
5.56
0.017
Error
14
0.008525
0.000609
Total
16
0.015300
Lot
Mean
StDev
Lot 1
0.50060
0.02943
Lot 2
0.53184
0.01773
Lot 3
0.47663
0.01948
----------+---------+---------+-----(-----*-----)
(--------*--------)
(-------*-------)
----------+---------+---------+------
Pooled StDev =
Jan-16
0.02468
0.480
Fethi Derbeli
0.510
0.540
26
Exemple Step 8
Interpreter la p-value (ou F-statistic)
Assumant que la supposition du rsidu est
satisfaisante:
Si p-value is < 0.05, rejeter Ho
Autrement, lhypothse nulle est vrais
Analysis of Variance for Burning
Source
DF
SS
MS
0.006775
0.003387
5.56
0.017
Error
14
0.008525
0.000609
Total
16
0.015300
Lot
Derbeli
ANOVAFethi
- 27
27
Exemple Step 8
Calculer le carre depsilon et lerreur
SS Lot
.006775
=
=
= .44
SS Total .015300
2
Jan-16
Fethi Derbeli
28
Exemple Step 9
: la supposition pour lerreur (analyse des rsidus)
Erreurs sont indpendantes et distribues normalement
Stat > Regression > Residual Plots
Residual Model Diagnostics
La normalit des
rsidus
I Chart of Residuals
0.1
0.04
UCL=0.07675
Residual
Residual
0.02
0.00
-0.02
0.0
Mean=-2.9E-17
Le comportement de
rsidus le long de
lexprience. Allure
normale.
-0.04
LCL=-0.07675
-0.06
-0.1
-2
-1
Normal Score
5
4
0.02
3
2
1
10
15
Residual
Frequency
Histogram of Residuals
Forme de
lhistogramme ?
Observation Number
0.00
-0.02
-0.04
0
-0.060
-0.045
-0.030
-0.0150.0000.0150.030
-0.06
0.4750.4850.4950.5050.5150.5250.535
Residual
Le modle
mathmatique a quel
degr est reprsentative
(les points qui ne colle
pas au modle).
Fit
Fethi Derbeli
29
Exemple Step 10
Traduire la conclusion statistique en langage
processus :
Les lots naffectent pas le taux de brlure. Mais le lot 2
prsente le taux le plus optimale.
Individual 95% CIs For Mean
Based on Pooled StDev
Level
Mean
StDev
Lot 1
0.50060
0.02943
Lot 2
0.53184
0.01773
Lot 3
0.47663
0.01948
----------+---------+---------+-----(-----*-----)
(--------*--------)
(-------*-------)
----------+---------+---------+------
Pooled StDev =
Jan-16
0.02468
0.480
Fethi Derbeli
0.510
0.540
30
Questions?
Jan-16
Fethi Derbeli
31