You are on page 1of 40

Cours de statistique descriptive

Valeur centrale dune distribution 23 octobre 2007 Michel Juillard

Plan du cours
1. Introduction. 2. Tableau statistique. 3. Reprsentation graphique. 4. Valeur centrale. 5. Mesure de la dispersion. 6. Mesure de la concentration. 7. Tableau double entre. 8. Indpendance de deux facteurs. 9. Moindres carrs ordinaires. 10. Coefcient de corrlation. 11. Indices et taux de croissance.

Plan du chapitre

Indroduction: rsumer une distribution Le mode La mdiane La moyenne

Rsumer une distribution

Il est souvent utile de rsumer une distribution par un ou deux nombres, par exemple, pour comparer des distributions diffrentes. Ces deux nombres sont la valeur centrale la dispersion Il existe plusieurs indicateurs possibles pour la valeur centrale ou la dispersion.

Exemple
Deux distributions qui ne varient que par leur valeur centrale:
Distribution 1 Distribution 2

200

150

Effectifs 100

50

2 x1

50

Effectifs 100

150

200

4 x2

Sur le mme histogramme


350 0 1.5 50 100 150 200 250 300

0.5

1.5

2.5

3.5

4.5

5.5

6.5

7.5

Diffrentes dispersions
400 0 4.5 100 200 300

2.5

0.5

1.5

3.5

5.5

7.5

9.5

Distributions asymtriques
La valeur centrale et la dispersion nindiquent rien concernant lasymtrie.
200 0 45 25 50 100 150

15

35

55

75

95

120

Indicateurs de la valeur centrale

Mode (caractres qualitatifs et quantitatifs) Mdiane (caractres quantitatifs) Moyenne (caractres quantitatifs)

Plan du chapitre

Indroduction: rsumer une distribution Le mode La mdiane La moyenne

Le mode

Dnition: Le mode est la valeur de la variable statistique pour laquelle la frquence est la plus leve. Le mode peut tre calcul pour les caractre qualitatifs comme pour les caractres quantitatifs.

Caractre qualitatif

Le mode est la modalit avec leffectif le plus important. Exemple:


Population active occupe par selon le statut des emplois, en 2004 Statut de lemploi Nonsalaris Salaris secteur priv Salaris secteur public Total Effectifs (en milliers) 2 669 17 270 4 789 24 728

Source: INSEE: enqutes emploi.

Le mode de la distribution est reprsent par les salaris du secteur priv.

Sur le diagramme
Il sagit du tuyau le plus haut
15000 0 nonsalaris 5000 Effectifs (milliers) 10000

salaris.priv

salaris.public

Population active par statut en 2004.

Source: INSEE enqutes emploi

Variables discrtes

Le mode est la valeur de la variable discrte avec leffectif le plus important. Exemple: distribution des jours douverture dun magasin suivant le nombre de ventes dun appareil A Nombres de ventes par jour 0 1 2 3 4 5 6 Total Source: B. Grais (2000) Le mode est gal 2 appareils par jour: il y a 75 jours o lon a vendu 2 appareils dans la journe. Nombres de jours 24 57 75 53 33 7 4 253

Sur le diagramme
Nombre de ventes par jour
70

Nombre de jours

10

20

30

40

50

60

Nombre de ventes par jour

Source: B. Grais (2000).

Variables continues

La dtermination du mode dans le cas dune variable continue est moins prcise que pour les variables qualitatives ou les variables discrtes. On peut dterminer la classe modale dnie comme la classe dont la frquence moyenne par unit dintervalle de classe est la plus leve B. Grais (2000) La frquence moyenne par unit dintervalle est proportionnelle la hauteur dun rectangle de lhistogramme.

Sur lhistogramme
Nombre de ventes par jour
35 Effectifs 0
800

10

15

20

25

30

900

1000

1100

1500

2000

Salaire mensuel (en euros)

A partir du tableau statistique

Classes de salaire (euros) 800 moins de 900 900 moins de 1000 1000 moins de 1100 1100 moins de 1500 1500 ou plus Total (Source: MJ) PGCD = 100

Distribution des salaires Amplitude Effectifs 100 100 100 400 = 4 100 500 = 5 100 1200 25 30 28 25 10 118

Hauteur
25 = 25 1 30 = 30 1 28 = 28 1 25 = 6, 3 4 10 = 2 5

Attention: la classe modale dpend du dcoupage des classes.

Proprits du mode

Avantages: Facile calculer Facile interprter Dsavantages: Sa mesure est imprcise dans le cas dune variable continue Le mode se prte mal au calcul algbrique

Plan du chapitre

Indroduction: rsumer une distribution Le mode La mdiane La moyenne

La mdiane

La valeur de la mdiane est telle que la moiti des observations ont une valeur infrieure la mdianne et la moiti une valeur suprieure la mdiane. La mdiane ne peut tre calcule que pour des caractres quantitatifs

Variables discrtes

Lorsquil existe un nombre impair dobservations Exemple: Nombre dappareils vendus pendant la semaine:
Lundi Mardi Mercredi Jeudi Vendredi 1 0 2 0 3

Calcul de la mdiane

Observations ordonnes: 0 (ma.), 0 (je.), 1 (lu.), 2 (me.), 3 (ve.) La mdiane est 1 appareil vendu par jour.

Un nombre pair dobservations

Nombre dappareils vendus pendant la semaine: Lundi Mardi Mercredi Jeudi Vendredi Samedi 1 0 2 0 3 3

Calcul de la mdiane

0 (ma.), 0 (je.), 1 (lu.), 2 (me.), 3 (ve.), 3 (sa)

Lintervalle mdian: (1, 2).

Calcul partir dun tableau

Distribution des jours douverture dun magasin suivant le nombre de ventes dun appareil A Nombres de ventes par jour 0 1 2 3 4 5 6 Total Source: B. Grais (2000) Nombres de jours 24 57 75 53 33 7 4 253 Frquences 9,5 % 22,5% 29,6% 21,0% 13,0% 2,8% 1,6% 100 % Frquences cumules 9,5% 32,0% 61,6% 82,6% 95,6% 98,4% 100,0%

Sur le graphique (I)


Nombre de ventes par jour
70

Nombre de jours

10

20

30

40

50

60

Nombre de ventes par jour

Source: B. Grais (2000).

Sur le graphique (II)


100 20 0 Frquences cumules 40 60 80

2 3 4 5 Nombre de ventes par jour

Source: B. Grais (2000) .

Nombre de ventes cumules

Variables continues

En gnral, la mdiane se trouve lintrieur dune classe. Sa valeur exacte est dtermine par interpolation linaire. Rpartition des
employs dune entreprise selon leur salaire mensuel net Classes de salaire (euros) 800 moins de 900 900 moins de 1000 1000 moins de 1100 1100 moins de 1500 1500 ou plus Total Effectifs Frquences (%) 21,2 25,4 23,7 21,2 8,5 100 Frquences cumules (%) 21,2 46,6 70,3 91.5 100

25 30 28 25 10 118

5046,6 Mdiane: 1000 + (1100 1000) 70,346,6 = 1014, 3

Sur le graphique
100 0 800 20 Frquences cumules (en %) 40 60 80

1000

1200 1400 1600 1800 Salaire mensuel (en euros)

2000

Source: B. Grais (2000).

Distribution cumulative des salaires

Proprits de la mdiane

Avantages: Facile calculer Facile interprter La mdiane nest pas inuence par des observations extrmes Dsavantages: La mdiane se prte mal au calcul algbrique

Plan du chapitre

Indroduction: rsumer une distribution Le mode La mdiane La moyenne


La moyenne arithmtique La moyenne gomtrique La moyenne harmonique

La moyenne arithmtique

Dnition: La moyenne arithmtique dune variable statistique est la somme des valeurs divise par le nombre dobservations. 1 n n i=1

x =

xi

Dans le cas de donnes groupes en J classes: 1 J n i=1

x =

n i xi

avec n =

J i=1 ni

La moyenne ne peut tre calcule que pour les caractres quantitatifs.

Variables discrtes

Exemple: Nombre dappareils vendus pendant la semaine:


Lundi Mardi Mercredi Jeudi Vendredi 1 0 2 0 3

Moyenne =

1+0+2+0+3 5

= 1, 2 appareils vendus par jour.

Calcul partir dun tableau


Distribution des jours douverture dun magasin suivant le nombre de ventes dun appareil A Nombres de ventes par jour 0 1 2 3 4 5 6 Total Moyenne pondre: 24 0 + 57 1 + 75 2 + 53 3 + 33 4 + 7 5 + 4 6 253 Nombres de jours 24 57 75 53 33 7 4 253 Frquences 9,5 % 22,5% 29,6% 21,0% 13,0% 2,8% 1,6% 100 %

= 2, 2

0.095 0 + 0, 225 1 + 0, 296 2 + 0, 21 3 + 0, 13 4 + 0, 028 5 + 0, 016 6 = 2, 2

Variables continues

On prend le centre de chaque classe comme valeur reprsentative pour cette classe.
Rpartition des employs dune entreprise selon leur salaire mensuel net Classes de salaire (euros) 800 moins de 900 900 moins de 1000 1000 moins de 1100 1100 moins de 1500 1500 ou plus Total Centre de classe 850 950 1050 1300 1750 Effectifs 25 30 28 25 10 118 Frquences (%) 21,2 25,4 23,7 21,2 8,5 100

Moyenne = 0, 212 850 + 0, 254 950 + 0, 237 1050 + 0, 212 1300 + 0, 085 1750 = 1094, 7

Proprits de la moyenne

Avantages: Facile calculer Facile interprter La moyenne se prte bien au calcul algbrique

Mode, mdiane, moyenne

Distribution symtrique: mode = mdiane = moyenne Distribution tale vers la droite: mode < mdiane < moyenne Distribution tale vers la gauche: moyenne < mdiane < mode

Moyenne gomtrique

Dnition: Exemple:

G = (x1 x2 x3 . . . xn ) n (1 2 5 7 10 13) 6 = 4, 57 Dans le cas de donnes groupes en J classes: G = J xini i=1 ave n =
J i=1 ni .
1 n 1

Moyenne harmonique

Dnition: H =

n
1 n i=1 xi

Exemple: 6
1 + 1 + 1 + 1 + 1 + 1 1 2 4 7 10 13

= 2, 97

Dans le cas de donnes groupes en J classes: n


ni J i=1 xi

H =

J avec n = i=1 ni . Rapport entre les diffrentes moyennes:

harmonique < gomtrique < arithmtique

You might also like