Professional Documents
Culture Documents
Plan du cours
1. Introduction. 2. Tableau statistique. 3. Reprsentation graphique. 4. Valeur centrale. 5. Mesure de la dispersion. 6. Mesure de la concentration. 7. Tableau double entre. 8. Indpendance de deux facteurs. 9. Moindres carrs ordinaires. 10. Coefcient de corrlation. 11. Indices et taux de croissance.
Plan du chapitre
Il est souvent utile de rsumer une distribution par un ou deux nombres, par exemple, pour comparer des distributions diffrentes. Ces deux nombres sont la valeur centrale la dispersion Il existe plusieurs indicateurs possibles pour la valeur centrale ou la dispersion.
Exemple
Deux distributions qui ne varient que par leur valeur centrale:
Distribution 1 Distribution 2
200
150
Effectifs 100
50
2 x1
50
Effectifs 100
150
200
4 x2
0.5
1.5
2.5
3.5
4.5
5.5
6.5
7.5
Diffrentes dispersions
400 0 4.5 100 200 300
2.5
0.5
1.5
3.5
5.5
7.5
9.5
Distributions asymtriques
La valeur centrale et la dispersion nindiquent rien concernant lasymtrie.
200 0 45 25 50 100 150
15
35
55
75
95
120
Mode (caractres qualitatifs et quantitatifs) Mdiane (caractres quantitatifs) Moyenne (caractres quantitatifs)
Plan du chapitre
Le mode
Dnition: Le mode est la valeur de la variable statistique pour laquelle la frquence est la plus leve. Le mode peut tre calcul pour les caractre qualitatifs comme pour les caractres quantitatifs.
Caractre qualitatif
Sur le diagramme
Il sagit du tuyau le plus haut
15000 0 nonsalaris 5000 Effectifs (milliers) 10000
salaris.priv
salaris.public
Variables discrtes
Le mode est la valeur de la variable discrte avec leffectif le plus important. Exemple: distribution des jours douverture dun magasin suivant le nombre de ventes dun appareil A Nombres de ventes par jour 0 1 2 3 4 5 6 Total Source: B. Grais (2000) Le mode est gal 2 appareils par jour: il y a 75 jours o lon a vendu 2 appareils dans la journe. Nombres de jours 24 57 75 53 33 7 4 253
Sur le diagramme
Nombre de ventes par jour
70
Nombre de jours
10
20
30
40
50
60
Variables continues
La dtermination du mode dans le cas dune variable continue est moins prcise que pour les variables qualitatives ou les variables discrtes. On peut dterminer la classe modale dnie comme la classe dont la frquence moyenne par unit dintervalle de classe est la plus leve B. Grais (2000) La frquence moyenne par unit dintervalle est proportionnelle la hauteur dun rectangle de lhistogramme.
Sur lhistogramme
Nombre de ventes par jour
35 Effectifs 0
800
10
15
20
25
30
900
1000
1100
1500
2000
Classes de salaire (euros) 800 moins de 900 900 moins de 1000 1000 moins de 1100 1100 moins de 1500 1500 ou plus Total (Source: MJ) PGCD = 100
Distribution des salaires Amplitude Effectifs 100 100 100 400 = 4 100 500 = 5 100 1200 25 30 28 25 10 118
Hauteur
25 = 25 1 30 = 30 1 28 = 28 1 25 = 6, 3 4 10 = 2 5
Proprits du mode
Avantages: Facile calculer Facile interprter Dsavantages: Sa mesure est imprcise dans le cas dune variable continue Le mode se prte mal au calcul algbrique
Plan du chapitre
La mdiane
La valeur de la mdiane est telle que la moiti des observations ont une valeur infrieure la mdianne et la moiti une valeur suprieure la mdiane. La mdiane ne peut tre calcule que pour des caractres quantitatifs
Variables discrtes
Lorsquil existe un nombre impair dobservations Exemple: Nombre dappareils vendus pendant la semaine:
Lundi Mardi Mercredi Jeudi Vendredi 1 0 2 0 3
Calcul de la mdiane
Observations ordonnes: 0 (ma.), 0 (je.), 1 (lu.), 2 (me.), 3 (ve.) La mdiane est 1 appareil vendu par jour.
Nombre dappareils vendus pendant la semaine: Lundi Mardi Mercredi Jeudi Vendredi Samedi 1 0 2 0 3 3
Calcul de la mdiane
Distribution des jours douverture dun magasin suivant le nombre de ventes dun appareil A Nombres de ventes par jour 0 1 2 3 4 5 6 Total Source: B. Grais (2000) Nombres de jours 24 57 75 53 33 7 4 253 Frquences 9,5 % 22,5% 29,6% 21,0% 13,0% 2,8% 1,6% 100 % Frquences cumules 9,5% 32,0% 61,6% 82,6% 95,6% 98,4% 100,0%
Nombre de jours
10
20
30
40
50
60
Variables continues
En gnral, la mdiane se trouve lintrieur dune classe. Sa valeur exacte est dtermine par interpolation linaire. Rpartition des
employs dune entreprise selon leur salaire mensuel net Classes de salaire (euros) 800 moins de 900 900 moins de 1000 1000 moins de 1100 1100 moins de 1500 1500 ou plus Total Effectifs Frquences (%) 21,2 25,4 23,7 21,2 8,5 100 Frquences cumules (%) 21,2 46,6 70,3 91.5 100
25 30 28 25 10 118
Sur le graphique
100 0 800 20 Frquences cumules (en %) 40 60 80
1000
2000
Proprits de la mdiane
Avantages: Facile calculer Facile interprter La mdiane nest pas inuence par des observations extrmes Dsavantages: La mdiane se prte mal au calcul algbrique
Plan du chapitre
La moyenne arithmtique
Dnition: La moyenne arithmtique dune variable statistique est la somme des valeurs divise par le nombre dobservations. 1 n n i=1
x =
xi
x =
n i xi
avec n =
J i=1 ni
Variables discrtes
Moyenne =
1+0+2+0+3 5
= 2, 2
Variables continues
On prend le centre de chaque classe comme valeur reprsentative pour cette classe.
Rpartition des employs dune entreprise selon leur salaire mensuel net Classes de salaire (euros) 800 moins de 900 900 moins de 1000 1000 moins de 1100 1100 moins de 1500 1500 ou plus Total Centre de classe 850 950 1050 1300 1750 Effectifs 25 30 28 25 10 118 Frquences (%) 21,2 25,4 23,7 21,2 8,5 100
Moyenne = 0, 212 850 + 0, 254 950 + 0, 237 1050 + 0, 212 1300 + 0, 085 1750 = 1094, 7
Proprits de la moyenne
Avantages: Facile calculer Facile interprter La moyenne se prte bien au calcul algbrique
Distribution symtrique: mode = mdiane = moyenne Distribution tale vers la droite: mode < mdiane < moyenne Distribution tale vers la gauche: moyenne < mdiane < mode
Moyenne gomtrique
Dnition: Exemple:
G = (x1 x2 x3 . . . xn ) n (1 2 5 7 10 13) 6 = 4, 57 Dans le cas de donnes groupes en J classes: G = J xini i=1 ave n =
J i=1 ni .
1 n 1
Moyenne harmonique
Dnition: H =
n
1 n i=1 xi
Exemple: 6
1 + 1 + 1 + 1 + 1 + 1 1 2 4 7 10 13
= 2, 97
H =