Professional Documents
Culture Documents
Le terme s'appelle la variance intraclasse. Il traduit la variation de X autour de sa moyenne, dans la partition {1, ... , s}. Le terme s 2 (MC (X)) s'appelle la variance interclasse. Il traduit la variation de la moyenne de X dans la partition {1, ... , s}. Note : Ce rsultat peut tre tendu une variable statistique discrte valeurs dans R q. g) Variance d'une variable statistique relle continue. Les classes [ ei, ei + 1 [, de frquences fi = , i [ 1, p ], forment une partition de X (). La variance de X s'obtientcette population, il faudra, en moyenne, 7 familles pour avoir 15 enfants, ou que 100 familles auront, en moyenne, 214 enfants.
a) Proprits de la moyenne.
Somme. La somme X + Y de deux variables statistiques X et Y est dfinie par : (X + Y) () = X () + Y (), pour tout . Nous avons alors crire : = (X + Y) () = (X () + Y ()) = X () + Y () = + Produit par un scalaire Le produit X d'une variable statistique X par un nombre rel est dfini par : (X) () = X (), pour tout . Nous pouvons alors crire : = (X) () = X () = . Ecart moyen la moyenne. = (X ) () = (X () ) = X () = 0 Soit une population de commerants, partitionne en trois catgories disjointes : A : les supermarchs, B : les moyennes surfaces, C : les petits dtaillants. Soit X le prix du litre d'huile. Soit le prix moyen du litre d'huile dans les supermarchs : c'est le quotient entre le prix de vente total de l'huile dans les supermarchs, et le nombre total de litres vendus dans les supermarchs. De mme, soit , le prix moyen du litre d'huile dans les moyennes surfaces. De mme, soit , le prix moyen du litre d'huile chez les petits dtaillants. La relation prcdente (thorme de la moyenne conditionne) permet de calculer le prix moyen du = fi = fi xi Deuxime hypothse. On peut calculer sa moyenne = ni (xi). est un nombre rel, compris entre la valeur minimum et la valeur maximum de (xi), i [ 1, p ]. Comme est une injection continue, il existe un unique R+ * tel que ( ) = Cours de Statistique - Chapitre 2 - Paramtres caractristiques Page 17 est appel la -moyenne de X.
Exemples de -moyennes.
1. Si est l'application identique dfinie par (x) = x, la -moyenne de X est la moyenne arithmtique de X, c'est la moyenne au sens ordinaire. 2. Si est dfinie par (x) = x 2, nous obtenons la moyenne quadratique q de X, dfinie par
q 2=
ni xi 2. 3. Si est dfinie par (x) = , nous obtenons la moyenne harmonique h de X, dfinie par = ni . 4. Si est dfinie par (x) = ln (x), nous obtenons la moyenne gomtrique g de X, dfinie par ln ( g) = ni ln (xi), soit g = xi
II. 2. 2. 1. Etendue
Soit X une variable statistique relle discrte. L'tendue de X est la diffrence entre la plus grande valeur de X et la plus petite valeur de X. Ce paramtre est souvent utilis dans les contrles de fabrication, pour lesquels on donne, a priori, des marges de construction. Son intrt est limit par le fait qu'il dpend uniquement des valeurs extrmes, qui peuvent tre des valeurs aberrantes.
Les quartiles partagent l'tendue en quatre intervalles qui ont le mme effectif. Le deuxime quartile, Q2, est gal la mdiane. L'intervalle interquartile est la diffrence entre les valeurs du troisime et du premier quartiles : Q3 Q1. L'intervalle [Q1, Q3] contient 50 % des valeurs de X. b) Variable statistique discrte. Pour une variable statistique relle discrte X, la courbe des frquences cumules est une courbe en escalier. S'il existe une valeur de x pour laquelle la frquence cumule est 0,25 (resp. 0,50, 0,75), le quartile correspondant est cette valeur de X. Sinon, les quartiles seront dtermins par interpolation linaire entre deux valeurs. = xmax xmin Cours de Statistique - Chapitre 2 - Paramtres caractristiques Page 19 c) Dciles et percentiles. Les 9 dciles sont les nombres rels qui partagent l'tendue en dix intervalles de mme effectif. Utilisation : en matire de salaires, le rapport est un paramtre de dispersion frquemment utilis. Les 99 percentiles sont les nombres rels qui partagent l'tendue en cent intervalles de mme effectif.
s 2 (X) = (X () ) 2 = ni ( xi ) 2 On appelle cart-type de X la racine carre s (X) de la variance de X. S = N s 2 (X) est la somme des carrs des carts : S = ni ( xi ) 2 b) Formulere quantitatif. La variable statistique est la mesure du caractre. Celle-ci peut tre discrte ou continue. Il existe deux types de reprsentation graphique d'une distribution statistique caractre quantitatif : Le diagramme diffrentiel correspond une reprsentation des effectifs ou des frquences. Le diagramme intgral correspond une reprsentation des effectifs cumuls, ou des frquences cumules.
Exemple.
En vue d'tablir rationnellement le nombre de postes de travail ncessaires pour assurer sa clientle un service satisfaisant, une agence de voyage a fait relever, minute par minute, le nombre d'appels tlphoniques reus au cours d'une priode de 30 jours. Cette opration a fourni, pour la tranche horaire de pointe qui se situe entre onze heures et midi, les rsultats suivants : La population tudie est celle des 1 800 minutes composant la dure totale des appels dans la tranche horaire de onze heures midi pendant 30 jours. Le caractre observ est le nombre d'appels tlphoniques : c'est un caractre quantitatif et la variable statistique correspondante, qui ne peut prendre que des valeurs entires, est discrte. La reprsentation des effectifs est identique celle des frquences : seule change l'chelle verticale. La reprsentation graphique diffrentielle correcte est le diagramme en btons. A chaque valeur xi de la variable, porte en abscisse, on fait correspondre un segment vertical de longueur proportionnelle la frquence fi de cette valeur. Le regroupement des valeurs extrmes de la variable en une seule classe (nombre d'appels suprieur ou gal 8) interdit normalement la reprsentation graphique de ce dernier segment. Mais, tant donne la frquence quasi ngligeable de cette classe, l'inconvnient n'est pas bien grand et l'on pourra reprsenter par un segment l'abscisse 8, la frquence des appels de dure 8 ou plus. Cours de Statistique - Chapitre 2 - Reprsentation graphique Page 8 La reprsentation graphique intgrale correcte est la courbe en escalier : les frquences des diverses valeurs de la variable statistique correspondent aux hauteurs des marches de la courbe en escalier.
Exemple.
La Fdration nationale de la rparation et du commerce de l'automobile a effectu une enqute auprs de ses adhrents visant mieux connatre la structure de ce secteur. Cette opration a fourni la rpartition suivante des entreprises de la rparation de du commerce de l'automobile selon leur chiffre d'affaires annuel. La masse de chiffres d'affaires correspondant aux entreprises de la premire et de la dernire classes s'lve respectivement 1 714 et 110 145 millions de francs. La population tudie est celle des entreprises de la rparation et du commerce de l'automobile. Le caractre observ est le chiffre d'affaires. C'est un caractre quantitatif et la variable statistique correspondante est continue. La reprsentation graphique diffrentielle correcte est l'histogramme des densits de frquences. Pour la premire et la dernire classes, l'amplitude de la classe n'est pas connue. On dtermine alors la moyenne de la classe, qu'on considre comme la valeur centrale de la classe (quand on construit un histogramme, on fait l'hypothse implicite que les effectifs sont rpartis uniformment l'intrieur de la classe, la moyenne de la classe est alors le centre de la classe). Pour la premire classe, la moyenne du chiffre d'affaires est = 0,125, de sorte que la premire classe est la classe [ 0,00 , 0,25 [. Pour la dernire classe, la moyenne du chiffre d'affaires est = 35, de sorte que la dernire classe est la classe [ 10,00 , 60,00 [. La reprsentation graphique intgrale correcte est la courbe cumulative des frquences. Pour que chaque point exprimental reprsente la fonction de rpartition, il faut prendre pour abscisses les limites suprieures des classes et, pour ordonnes, les frquences cumules correspondantes.
Cours de Statistique - Chapitre 2 - Reprsentation graphique Page 10 Comme la variable statistique est continue, on tracera une courbe cumulative continue, et non une courbe en escalier, de faon qu' une valeur de frquence cumule corresponde une et une seule valeur de variable. Entre deux points exprimentaux, on trace un segment de droite reprsentant l'interpolation linaire, ou bien une courbe lisse, asymptotiquement tangente l'horizontale d'ordonne 100. Cours de Statistique - Chapitre 2 - Reprsentation graphique Page 11