You are on page 1of 76

UV SQ 20

Probabilits Statistiques
UV SQ 20
Automne 2006
Responsable d Rmy Garandel
( m.-el. remy.garandel@utbm.fr ) page 1

SQ-20 Probabilits - Statistiques

Bibliographie:
Titre Auteur(s) Editions Localisation Introduction la statistique Amzallag, Piccioli, Bry Hermann Bib. ENI Probabilits et statistiques Coll FLASH U A. Colin B.M. Belfort n519 07 REA Initiation pratique la statistique A. Liorzou Gauthier Villars Bibl ENI Probabilits et Statistiques appliques Lacaze, Mailhes, Cpadus Bibl Utbm Sv. n QA 273 Pro Statistiques et probabilits J. P. Lecoutre Dunod Bibl Utbm Svenans Niveaux des livres : - trs (trop) facile, + niveau de SQ 20, ++ pour des prolongements, +++ : comptition Niveau + + puis ++ +

Quelques livres intressants, instructifs ou rjouissants (proprits ne sexcluant pas) : Etienne Klein : Latome au pied du mur Ed. Le Pommier Des nouvelles caractre historique et scientifique crites avec humour. De quoi ensoleiller les journes moroses J. Paul Delahaye Jeux mathmatiques et mathmatiques des jeux Bibliothque Pour la Science Etude probabiliste des jeux de hasard partir de situations plus ou moins simples Ch. Ruhla La physique du hasard Ed. Hachette Bibl. Municipale Belfort n 530 13 RUH Survol chronologique des phnomnes alatoires en physique, difficult croissante au cours des chapitres J. Merlino Les jargonautes B. M. Belfort Petite tude humoristique sur le langage actuel Simon Singh Histoire des codes secrets Intressera tous les mathmaticiens

Ce cours a t enseign lUTBM, Universit de Technologie de Belfort-Montbliard depuis la cration de cette universit de Technologie, cest--dire septembre 1999. Il correspond lUnit de Valeur SQ 20 Probabilits et Statistiques, dans laquelle le volume horaire tait de 32 heures de cours et 28 heures de Travaux Dirigs. Remarques prliminaires : Ce document comprend plus dexercices quil est possible den faire pendant les sances de TD. Le but en est multiple. Dabord davoir une certaine varit dans les diffrents groupes et ensuite de permettre aux tudiants qui le souhaitent de faire les exercices qui nauront pas t traits dans leurs sances de TD. On peut toujours demander des lments de solution aux enseignants, ou des tudiants des autres groupes qui les ont peut-tre rsolus. Certains exercices sont nots * , ** ou ***. Ils correspondent des exercices demandant une certaine recherche dans le raisonnement, ou ceux qui dpassent le programme de lUV, mais pas les capacits intellectuelles des tudiants brillants. Mais ne le sont-ils pas tous ?

page 2

UV SQ 20

Chap.1

Espaces Probabiliss

-I- Introduction:
1) Le hasard Le calcul des probabilits est ltude des phnomnes alatoires, du mot latin alea = hasard. Cette notion nest dailleurs pas trs facile cerner. Ce quon nomme hasard peut tre d simplement un phnomne quon matrise mal, ou dont on ne connat pas les causes. Il y a quelques millnaires, lapparition dune clipse pouvait tre considre comme un phnomne relevant du hasard alors quaprs la dcouverte des lois de la gravit et de lorbite des objets clestes du systme solaire, il devient un phnomne entirement dtermin. De mme le lancer dune pice de monnaie, exemple mme du phnomne alatoire, na rien de hasardeux condition de connatre avec prcision tous les paramtres du mouvement. Ds que la pice est lance, son trajet est entirement dtermin, ainsi que le rsultat du lancer. Alors, le hasard ? Existe-t-il vraiment, ou est-il simplement une mesure de notre incomptence ? On peut considrer le monde comme un environnement totalement dtermin, tendance Laplace, ou au contraire, considrer quil existe une part incompressible de hasard, (Cf. le principe dincertitude de Heisenberg) dans laquelle on peut loger un espace de libert. 2) Probabilits objectives et subjectives : Avant de dfinir la probabilit, il est ncessaire de considrer la notion de frquence. Soit une exprience deux issues, succs et chec, qui est rpte n fois dans les mmes conditions. nombre de succs La frquence de succs scrit f n = . n On peut ainsi dfinir la probabilit de succs dune exprience alatoire par p = lim f n p 0, 1 , le
n

problme tant que cette probabilit ne peut tre connue quaprs une infinit dexpriences. Dans certains cas, il est possible de contourner cette difficult par des considrations gomtriques. Par exemple, pour le lancer dun d cubique parfaitement quilibr (mais lest-il parfaitement ?), chaque face on peut attribuer la probabilit 1/6. La dfinition de la probabilit dun vnement ainsi donne peut tre appele probabilit objective. Une autre dfinition, beaucoup plus floue, celle de la probabilit subjective, serait combien un joueur serait prt parier sur un rsultat ?
Par exemple, on demande un tudiant dvaluer ses chances de succs un examen, cest--dire sa probabilit de russite p[0, +1]. Puis on lui propose lexprience suivante : faire tourner une aiguille sur un axe situ au dessus dun disque dont un secteur dangle est blanc, le reste tant color. Aprs rotation de laiguille, si elle sarrte sur le secteur blanc, on lui donne son examen, sinon Puis on lui donne le choix, passer effectivement lexamen ou laisser laiguille, donc laisser le hasard dcider. En fonction de langle ltudiant choisira lune ou lautre solution, ce qui permettra dvaluer sa probabilit subjective p.

Pour terminer cette introduction, il faudrait prciser que le Calcul des Probabilits nest pas quun amusement de mathmaticien. Il est utilis dans des domaines aussi divers que la fiabilit, les assurances, la gestion des stocks ou des siges mis la vente par les compagnies ariennes, la vitesse des conducteurs (y a-t-il un radar sur ma route ?) et bien sr les jeux de hasard (Cf. les bnfices de la Franaise des Jeux). Sans le calcul des probabilits les compagnies dassurances seraient ingrables, ou avec des primes dissuasives, et les compagnies ariennes ne pratiqueraient pas la surrservation, qui peut avoir ses avantages pour certains passagers. Il est intressant, par exemple en sance de TD, de pratiquer des expriences pour vrifier ladquation entre la thorie (calculs effectifs) et la pratique (observation).
page 3

SQ-20 Probabilits - Statistiques

-II- Algbre dvnements


Dans ce cours, nous allons utiliser des probabilits sur R ou des sous-ensembles de R. En fonction de la nature de ces sous-ensembles, ensembles discrets, intervalles, etc., les mthodes de calcul seront diffrentes. Un peu plus loin, nous prolongerons ltude sur des parties de Rn. 1) Sous-ensembles de R : a) Ensemble finis: Dfinition : On dira que R est un ensemble fini sil existe un entier nN, quon note Card(), cardinal de , et une bijection de dans {1, 2, ... , n}. Quelques exemples densembles finis : les ensembles de la forme {1, 2, ... , n} nN* bien sr, mais aussi lensemble vide Lensemble des tudiants de premire anne dans une Universit Sur les ensembles finis sapplique toute lanalyse combinatoire, cest dire les dnombrements. b) Ensembles dnombrables: Dfinition : On dira que R est un ensemble dnombrable sil existe une bijection de dans N. Par prolongement, on a les ensembles dnombrables au sens strict, qui correspondent la dfinition ci-dessus, ou les ensembles dnombrables au sens large qui sont finis ou dnombrables.
(On peut aussi dfinir un ensemble dnombrable au sens large en disant quil existe une application injective de dans N, mais cette dfinition ne fait pas la diffrence entre les ensembles finis et les ensembles infinis, diffrence qui sera utilise pour certaines notions, moments dune variable alatoire par exemple, page 16)

Quelques exemples densemble dnombrables, en dehors de N : Z (ensemble des entiers relatifs), Q (ensemble des fractions rationnelles), tout ensemble de points isols dans R1. Par contre un intervalle ouvert de R nest pas dnombrable (dmonstration par le procd diagonal de Cantor) . De plus, tout sous-ensemble dun ensemble dnombrable est dnombrable (au sens large). Un ensemble de points isols sera appel un ensemble discret. c) Les autres: Parmi les autres ensembles, qui ne font donc pas partie des ensembles ci-dessus, une place prpondrente sera accorde des ensembles dits continus, cest dire constitus dintervalles non rduits un point de R ou dune runion de ce type dintervalles. Ces ensembles ne constituent pas lintgralit des ensembles utiliss dans la thorie des probabilits, loin del, mais, pour la plupart des autres, il est ncessaire dutiliser la thorie de la mesure, ce qui dpasse largement le cadre de ce cours. 2) Dnombrements : Lanalyse combinatoire est ltude des dnombrements sur les ensembles finis. Il est des mthodes quil est bon de connatre pour rsoudre certains problmes de probabilits. Ltude des bases de lanalyse combinatoire ayant t faite dans le secondaire, nous ne ferons que de brefs rappels, pour les dmonstrations, voir le cours de terminale. a) Nombre de parties dun ensemble Soit un ensemble fini de cardinal n, on montre par rcurrence que le nombre de sous-ensembles (parties) de est Card(P()) = 2n. Cette relation est aussi vrifie pour n = 0. b) Permutations : Une permutation sur un ensemble fini de cardinal n, est une bijection de sur lui-mme. On peut, moyennant une bijection sur En={1, 2, . . . ,n} pour n entier naturel non nul, compter le nombre de permutations sur En.
Un point x dun sous-ensemble E de R est dit isol dans E sil existe un voisinage de x ne contenant aucun autre lment de E.
1

page 4

UV SQ 20

On montre par rcurrence que le nombre de permutations sur En est n ! = 12. . . n . Par convention on attribue la valeur 1 0!. c) Arrangements Un arrangement est une application injective de Ep={1, 2, . . . ,p} dans En={1, 2, . . . ,n}. Cest aussi un tirage successif et sans remise de p lments ordonns dans un ensemble de n lments. Une telle application nexiste que si p n, et dailleurs si p = n on est ramen au cas prcdent. n! si n p et A p = 0 sinon Le nombre darrangements est not A p et on montre que A p = n n n ( n p)! (on le note aussi P(n, p), cette notation, plus simple pour les typographes, est souvent utilise sur les calculatrices). d) Combinaisons Une combinaison est un tirage simultan de p lments dans un ensemble de n lments. Contrairement aux permutations, on ne tient pas compte de lordre dans lequel ces lments sont tirs. A chaque combinaison de p lments, on peut donc associer p ! permutations diffrentes, ce qui nous donne n Ap n! lexpression du nombre de combinaisons : C p = = n = . Suivant les sources on trouvera n p p! p!( n p)! les deux notations. Historiquement, la premire a t utilise par les franais, pour bien noter le C de combinaison, alors que la seconde se trouve dans la littrature anglo-saxonne. On peut, titre dexercice en dduire la formule du binme de Newton :

FG IJ HK

n N , (a , b) R

ba + bg

= C k a k b n k ainsi que le cas particulier o a + b = 1, bien utile n


k =0

pour les probabilits discrtes. On conviendra que C p = 0 et A p = 0 dans le cas p > n. n n 3) Exemples de dnombrements : a) Planche de Galton : Soit une planche incline munie de clous suivant la disposition ci-contre, n+1 lignes numrotes de 0 n. On lance une bille sur le premier clou, et elle se dirige droite ou gauche pour arriver un autre clou et ainsi de suite jusquaux numros de bas de grille. Pour un numro k{0, , n}, la trajectoire peut se coder suivant une suite (x1, , xn) o xk =0 ou 1 suivant que la bille va droite ou gauche, avec k fois 1 et (nk) fois 0 . On choisit donc k rangs de la suite parmi les n auxquels on associe le rsultat 1. On a donc C k chemins diffrents pour se rendre la n case k. Cet exemple est assez riche pour quon puisse reconstruire les formules sur les combinaisons, en particulier le triangle de Pascal. 4) Tribus dvnements : On considre une exprience alatoire dont lensemble est lensemble de tous les rsultats possibles. Une partie A de est appele un vnement. Si le rsultat est dans A, on dira que lvnement A est ralis. Lobjectif du calcul des probabilits est dvaluer les chances de ralisation dun vnement. Il sagit donc, si possible, dattribuer une probabilit un sous-ensemble de , comme on attribue une aire une surface. Une partie A de P() = ensemble de toutes les parties de , est une algbre dvnements si A est stable par les oprations boolennes usuelles, intersection finie, complmentarit et si elle contient . Du fait que A est stable par intersection et complmentarit, elle est ncessairement stable par runion, et de plus, contenant , elle contient aussi .
page 5

SQ-20 Probabilits - Statistiques

On peut prolonger cette dfinition avec la stabilit par intersection dnombrable pour obtenir une structure de tribu dvnements quon trouve aussi sous la dnomination algbre, le prfixe symbolisant gnralement le passage du fini au dnombrable. Dans tous les cas, est fini ou infini, dnombrable ou non dnombrable, lalgbre (ou la tribu dans (). le cas infini) minimale est lensemble {, } et la maximale est P Dans ce cours nous tudierons essentiellement trois types densembles : finis, infinis dnombrables et intervalles (a, b), ouverts ou ferms, de R avec a < b. Les algbres ou les tribus que nous tudierons, sauf mention contraire, seront les ensembles P si est un ensemble discret () lensemble des borliens (tribu engendre par les intervalles de R) si =R. Certains vnements sont utiliss frquemment, cest le cas de lvnement certain , des vnements lmentaires, cest dire nayant quun seul lment, et de lvnement impossible

-III- Espaces probabiliss :


La notion intuitive de probabilit objective introduite laide de frquences, ainsi que celle de probabilit subjective, sont insuffisantes pour btir une thorie cohrente et viter certaines erreurs grossires. Il est donc ncessaire de mettre en forme une axiomatique du calcul des probabilits. 1) Probabilit sur un ensemble : Soit un ensemble et une tribu dvnements A dfinie sur E. Dfinition : Lapplication p est une probabilit sur si 1. p est une application de A sur lintervalle [0, 1] 2. p() = 1 3. si A A et B A avec AB= (vnements incompatibles) alors p(AB) = p(A) + p(B). 4. Pour toute suite dvnements An , nN, deux deux disjoints ( i j A i A j = ) on a p

FG U A IJ = p(A ) H K
n n n N n N

(additivit)

On dfinit ainsi un espace probabilis qui est le triplet (, A , p). Il est dailleurs possible, partir du mme ensemble de dfinir plusieurs espaces probabiliss diffrents. Plusieurs tribus dvnements peuvent tre dfinies sur le mme , et pour une mme tribu, on peut construire des probabilits diffrentes. Nous en verrons un exemple avec le paradoxe de Bertrand (Cf. page 9). 2) Proprits : De la dfinition dune probabilit, on dduit (facilement) les proprits : P() = 0, lvnement est appel vnement impossible2, par exemple obtenir un 7 en lanant un d cubique normal . A A , B A p(AB) = p(A) + p(B) p(AB) p( A ) = 1 p(A ) avec A = \ A

-IV- Indpendance et probabilits conditionnelles


Soit dans un espace probabilis (, A , p) deux vnements A, de probabilit non nulle, et B. Les vnements peuvent tre raliss simultanment si leur intersection nest pas vide, mais on peut se poLvnement impossible nest dailleurs pas le seul vnement de probabilit nulle. Par exemple, un tirage au hasard dun nombre entre 0 et 1 fournit des probabilits nulles pour tous les vnements de la forme {x, x[0, 1]}, mais un tel rsultat, quoique trs improbable, nest pas impossible.
2

page 6

UV SQ 20

ser la question : la ralisation de A a-t-elle une influence sur celle de B ? En dautres termes, la probabilit de B est-elle la mme quand on sait que A est ralis ?
Par exemple le donneur de cartes au poker qui a pris soin de regarder la dernire carte du paquet (par exemple lAs de ) avant de commencer sa distribution. Il a donc une information supplmentaire vnement A = lAs de ne sera pas distribu dont il sait quil est ralis.

1) Probabilits conditionnelles Ceci nous amne la dfinition de la probabilit conditionnelle p|A, cest--dire la probabilit dun vnement B sachant que A est ralis. On construit ainsi un nouvel espace probabilis (=A, A , p|A) o A ={BA, B A} et la probap(A B) bilit : B, p|A ( B) = p( B| A ) = . p(A ) On vrifie que (=A, A , p|A) est bien un nouvel espace probabilis qui vrifie les proprits 1 4. 2) Indpendance En reprenant notre point de dpart, on peut dfinir lindpendance de deux vnements, cest--dire la proprit que la ralisation de lun deux na pas dinfluence sur celle de lautre. On dira, par dfinition, que B est indpendant de A (tel que p(A)0) si p|A(B) = p(B). p(A B) Dans ce cas, p|A ( B) = = p( B) ce qui implique p(A B) = p(A ). p( B) (rgle de multiplip( A ) cation). On peut remarquer que cette dernire relation est symtrique en A et B, et, si la probabilit de B est non nulle : B indpendant de A A indpendant de B. Les deux dfinitions p|A ( B) = p( B) et p(A B) = p(A ). p( B) quon pourrait donner de lindpendance ne sont quivalentes que si les probabilits de A et B ne sont pas nulles. Pour la suite nous prendrons la dfinition suivante, ce qui permettra de lutiliser aussi dans le cas o la probabilit dun vnement est nulle: A et B sont indpendants si et seulement si p (A B) = p(A) p(B) 3) Proprits immdiates : Les vnements et sont indpendants de tous les autres. Si p(A) 0 , p(B) 0 et AB= alors A et B ne sont pas indpendants. En effet la ralisation de lun rend lautre impossible. A ce propos il convient de bien faire la diffrence entre des vnements incompatibles A B = et des vnements indpendants p(A B) = p(A ). p( B) . p(A B) De la relation p|A ( B) = on dduit p (A B) = p(A) p(B|A), quon utilise en particulier pour p( A ) des tudes de fiabilit. 4) Exemples Les cas dindpendance sont (heureusement) trs frquents, et lhypothse dindpendance sera abondamment utilise quand nous aborderons la partie Statistiques. Dans limmdiat donnons quelques exemples : Tirages alatoires successifs avec remise dlments dans une bote Rponses une question donne par des sonds ne se concertant pas Rsultats de lancers successifs dun d (dont on suppose quil ne suse pas !) Dans dautres situations, on introduit lhypothse dindpendance pour simplifier les calculs, en esprant que la diffrence entre les rsultats est ngligeable, en fait infrieure la prcision dont on a besoin pour les calculs. Cest le cas par exemple de : Tirages alatoires successifs sans remise dun petit nombre lments dans une bote en contenant un grand nombre
page 7

SQ-20 Probabilits - Statistiques

Le sexe des enfants dun mme couple de parents Le nombre de crevaisons pendant un an de deux conducteurs (sils nempruntent pas systmatiquement les mmes itinraires, devant une usine de recyclage de verre notamment) Pannes des composants monts en parallle dun dispositif lectronique Tailles des tudiants dune Universit Dans tous les cas il est bon de vrifier lindpendance des vnements dont on veut calculer la probabilit
Exemple : Dans une salle se trouvent n personnes, n2. Calculer en fonction de n la probabilit quils aient tous des mois de naissance diffrents. Dans cet exemple, et cest souvent le cas dans les tudes de phnomnes alatoires, lnonc est trs incomplet et il est ncessaire dintroduire des hypothses supplmentaires, pour prciser certains points ou oprer des simplifications. La premire est de supposer que toutes ces personnes ont des jours de naissance indpendants, ce qui parat assez raliste, sauf sil y a des jumeaux dans lassemble. Ensuite, pour simplifier le problme, on peut supposer que les 365 jours de lanne, ou les 12 mois, sont quiprobables quant la naissance. Cest beaucoup moins rigoureux, pour ne pas dire pas du tout, que le premier point. En effet les naissances ne se rpartissent pas uniformment sur lanne (convenances personnelles, rveil du printemps ou panne gnrale de tlvision pendant quelques jours, . ), et de plus les mois nont pas tous le mme nombre de jours. Et que faire des annes bissextiles ? Pour modliser le problme, on peut le reprsenter par une application f de E = {1, 2, , n} dans F = {1, 2, , 12}, toutes les applications tant quiprobables, cest dire de probabilit p = 1 . Lvnement A = tous les mois 12 n de naissance sont diffrents est associ lvnement B = lapplication f est injective . Si n > 12 le problme est rsolu immdiatement, la probabilit de A est nulle. n Si n12, on a nombre dapplications injectives = A n et donc p(A ) = nb d ' applications injectives E F = A 12 . Par 12 nb d ' applications E F 12 n exemple, pour n = 6 on a p(A) = 0,223 0,001. On peut parier sans risque excessif devant une assemble de 6 personnes que deux dentre elles sont nes le mme mois. On prend successivement n = 20, n = 25 et n = 30. Quelle est la probabilit que deux dentre elles aient des dates de naissance identiques ? Le problmes est le mme, avec les mmes approximations, mais il y a 365 jours au lieu de 12 mois et on considre lvnement C = tous les jours anniversaires sont diffrents . Dans le cas gnral n compris entre 2 et 365, on a la probabilit p( C) =
n A 365

365n

, ce qui donne les probabilits 0,59 pour n = 20 (0,43 pour 25 et 0,29 pour 30). L encore on

peut prendre les paris sur un groupe de 30 personnes.

5) Systme complet dvnements Dans un espace probabilis (, A , p) on appelle systme complet dvnements S ={Ak, kD} avec D = N ou D = {1, 2, , n} une partition finie ou dnombrable de . Les ensembles Ak tant disjoints deux deux, on peut crire la formule des probabilits totales : B, B =
k D

UB A

et donc p( B) = p B A k = p B| A k p(A k )
k D k D

Formule de Bayes : Si S ={Ak, k{1, 2, , n}} un systme complet fini dvnements Ak sont tels que p(Ak) 0, on a, p( B| A k ) p(A k ) pour tout B tel que p(B) 0 : p(A k | B) = n p( B| A k ) p(A k )
k =1

On peut traiter titre dexercice lexemple suivant : Dans un atelier quatre machines A, B, C et D fabriquent la mme pice la mme cadence. La production est entrepose sans souci de provenance. On s'aperoit posteriori que la machine A a t mal rgle et que sa production est inacceptable. Par ailleurs les proportions de pices inacceptables sont, pour B, C et D de 2%, 3% et 5%. a) On prend au hasard une pice dans le stock. Probabilit qu'elle soit dfectueuse ? b) Une pice est dfectueuse. Quelle est la probabilit pour qu'elle vienne de A, de B ?

page 8

UV SQ 20

-V- Hypothse dquiprobabilit :


1) Cas o est fini : tant donn un ensemble fini , par exemple {1, 2, , n} nN*, un cas trs frquent est celui o tous les vnements lmentaires {k} ont la mme probabilit. On a donc :
p {1} = K = p {n} et p() = p et donc k , p({k}) =

b g

b g

FG U {k}IJ = pb{k}g les vnements tant disjoints deux deux, H K


n n k =1 k =1

1 n On dira dans ce cas que lespace probabilis vrifie lhypothse dquiprobabilit. On trouve cette situation dans les cas o on peut voquer une symtrie physique (d cubique ou pice de monnaie parfaitement quilibrs) ou labsence dinformations sur un phnomne alatoire, o aucun rsultat ne semble plus prvisible que les autres. Un jeu de cartes bien battu ne fournit aucune information quant au classement des cartes, et par consquent toutes les cartes ont la mme probabilit de sortie loccasion dun tirage. Bien sr il faut tre trs prudent dans lutilisation de cette hypothse. Labsence dinformations nimplique pas ncessairement lquiprobabilit.

2) Cas o est infini dnombrable Ce cas est trait rapidement. En effet, il est impossible dintroduire une hypothse dquiprobabilit dans ce cas pour des raisons videntes. Le cardinal de tant infini on aurait

pb{k}g
k =1

= 1 et donc 1

serait la somme dune srie termes constants, qui diverge si la constante est non nulle, et qui est nulle si tous les termes sont nuls. 3) Cas o est un intervalle born (non rduit un point) de R Dans le cas o = (a, b), a < b, intervalle (semi-)ouvert ou (semi-)ferm born de R, on dira que lespace probabilis (, A , p) vrifie lhypothse dquiprobabilit si la probabilit dun intervalle (c, d) (a, b) est proportionnelle la longueur dc de lintervalle. p ( c, d ) dc On a donc a c d b = . p ( a , b) ba On peut remarquer que si lhypothse dquiprobabilit est vrifie, la probabilit dun point est nulle, et donc que le fait que lintervalle (c, d) soit ouvert ou ferm na aucune influence sur sa probabilit. En effet p c, d = p {c} + p c, d + p {c} = p c, d .

b b

g g

h b g c

h b g c

On utilisera, avec les prcautions dusage, cette hypothse dans le cas o on effectue un tirage au hasard dun nombre rel dans un intervalle de longueur non nulle. 4) tude de cas : paradoxe de Bertrand Considrons la situation suivante : on trace une corde [A, B] sur un cercle (C), en supposant A et B choisis au hasard sur le cercle. On cherche valuer la probabilit de lvnement E = la longueur de la corde est suprieure celle du ct du triangle quilatral inscrit dans le cercle. Par homothtie, on peut supposer que le cercle a pour rayon R = 1. Le problme est de savoir ce quon entend par au hasard. a) Premire situation : On peut, moyennant une simplification, ventuellement abusive, que A est fix et que B est choisi au hasard sur le cercle. On a donc lespace probabilis (1, A 1, p1) o 1 est le cercle, la tribu est la tribu maximale P 1) et p1 est la probabilit uniforme sur le cercle, quon peut associer (
page 9

SQ-20 Probabilits - Statistiques

par bijection la probabilit uniforme sur lintervalle [0, 2[. Dans ce cas, lvnement E est ralis si B se trouve sur larc CD, et, la probabilit tant uniforme longueur de CD 1 sur le cercle p1 ( E) = = . circonfrence du cercle 3 b) Deuxime situation : On considre maintenant que le segment [A,B] est entirement dtermin si on en connat le milieu I. Le nouvel espace probabilis est dfini par (2, A 2, p2) o 2 est le disque, la tribu est P 2) et p2 est la probabilit uniforme sur le disque, la probabilit ( dun domaine du disque tant proportionnelle son aire. Dans ce cas E est ralis si I se trouve lintrieur du disque (C) de centre O et de rayon moiti. On a donc : aire de (C' ) 1 p 2 ( E) = = . aire de (C) 4 c) Troisime situation : Pour des raisons de symtrie, encore, on peut considrer que I est uniformment distribu sur un rayon [O,F]. Dans ce cas lvnement est ralis si I se trouve sur la premire moiti du rayon. On a donc lespace probabilis (3, A3, p3) o 3 est le rayon, la tribu est la tribu maximale P 3) et p3 est la probabilit uniforme sur le ( 1 rayon. On a donc p 3 ( E) = . 2 En rsum, en fonction de la dfinition du terme au hasard et de lespace probabilis, on a des rsultats diffrents. On aurait pu considrer une quatrime situation en considrant que A nest pas fix et que les deux points A et B sont choisis uniformment sur le cercle.

-VI- Exercices et Problmes:


1) Ecrire le dveloppement de 1+ x En dduire S1 =

b g

k =0 n

n N* .

k =0

C k , S2 = n

( 1) k C k , S3 = n

k =0

k C k et S4 = n

k
k =0

Ck n

2) Pour une UV dans laquelle sont inscrits 40 tudiants et 20 tudiantes, combien de cours doit on faire pour puiser toutes les possibilits dans les cas suivants : On considre lensemble des tudiants prsents (la disposition dans la salle importe peu) Aucune fille nest absente Ils prennent place dans une salle de 60 places et tous les inscrits sont prsents 50 inscrits sont prsents et les 10 places de devant sont vides 3) Soit deux ensembles E = {1, 2, , p} et F = {1, 2, , n}. a) Combien peut-on construire dapplications de E dans F ? b) - - - - - - - - - - injectives de E dans F ? c) - - - - - - strictement croissantes de E dans F ? d) ** - - - - - - - - - - surjectives de E dans F 4) Neuf touristes embarquent dans trois bateaux pouvant chacun recevoir de 0 9 passagers. Quelles sont les probabilits des vnements suivants : Chaque bateau embarque trois personnes Aucun bateau nest vide Dans chaque bateau il y a au moins 2 personnes et au plus 4.
page 10

UV SQ 20

5) ** Prolongement et application la Physique de l'exercice prcdent: (corrig page 69) En Physique, on est amen tudier la rpartition de n particules, chacune pouvant prendre N tats diffrents (un tat = point dans l'espace des phases). Le problme est donc d'tudier la rpartition de n particules dans N botes. a) Statistique de Maxwell-Boltzmann (applicable des molcules de gaz): on suppose que toutes les rpartitions sont quiprobables. Dterminer l'ensemble 1 des rpartitions possibles, ainsi que la probabilit que la premire bote contienne k particules, avec k{0, 1, , n}. b) Statistique de Bose-Einstein (applicable des photons): on suppose que les particules sont maintenant indiscernables. Dterminer l'ensemble 2 des rpartitions possibles, ainsi que la probabilit que la premire bote contienne k particules, avec k{0, 1, , n}. c) Statistique de Fermi-Dirac (applicable des lectrons): on suppose que les particules sont indiscernables et que chaque bote contient au plus une particule, et par consquent n N . Dterminer l'ensemble 3 des rpartitions possibles, ainsi que la probabilit que la premire bote contienne une particule. 6) Dfinir lensemble et dterminer Card() dans les situations suivantes : On lance trois fois un mme d cubique. On distribue cinq cartes un joueur extraites dun un jeu de 32 On tire au hasard la grille de dpart dun Grand Prix de Formule 1 (20 concurrents) - - - le podium dune course automobile (25 concurrents) 7) On considre l'ensemble N* ou N, l'algbre A =P(N*) et une probabilit p sur A. Dans chacun des cas suivant, calculer, si possible, la constante pour que p soit effectivement une probabilit sur A. a ) n N * p n = 3 b ) n N * p n = c) n N p n = n 2 2 n + 3n + 2 n n

cl qh

cl qh

cl qh

8) Peut-on dfinir une probabilit p sur , contenant les parties A, B et C, avec C = AB, satisfaisant aux conditions suivantes: a) p(A) = 0,8 p(B) = 0,1 p(C) = 0,2. b) p(A) = 0,8 p(B) = 0,4 p(C) = 0,1. c) p(A) = 0,8 p(B) = 0,4 p(C) = 0,3 p(AB)= 0,9 9) Soit (, P(), p) un espace probabilis et trois parties A, B et C de , telles que: p(A ) = 0,3 p( B) = 0,5 p(A C) = 0,1 p(A B C) = 0,1 p( B C) = 0,25 p(A B C) = 0,05 a) Dans quel intervalle doit-on choisir p(C) pour que p soit effectivement une probabilit ? b) On choisit p C (A B) = 0,2 . Dterminer les probabilits de vnements suivants:

C, 10)

ABC,

A B C , B A ,

A B C ,

A B C ,

AB

Le programme d'un examen comporte: 10 chapitres sur les sries, 4 chapitres sur les intgrales multiples, 6 chapitres de probabilits et 10 chapitres d'algbre linaire. Les modalits sont les suivantes: Le candidat tire au sort trois questions parmi les 30 qui sont proposes, chacune des questions portant sur un chapitre et un seul, et choisit de traiter une des questions. a) Combien de chapitres doit-il travailler pour tre certain de russir son examen ? b) Dterminer les probabilits des vnements suivants: Il ne tire aucune question de probabilits Il tire trois questions sur des domaines diffrents
page 11

SQ-20 Probabilits - Statistiques Il tire trois questions sur le mme sujet.

c) Un candidat ne rvise que l'algbre linaire. Quelle est la probabilit qu'il soit reu ? d) Un autre candidat est compltement nul en algbre linaire (toute ressemblance avec des personnes. . . ), quelle est la probabilit qu'il soit reu ? e) Dans quelle mesure l'impasse sur certaines parties de programme est-elle intressante ? 11) On pense savoir que, avec la probabilit 0,8, A est coupable du crime pour lequel il va tre jug. B et C, chacun deux sachant si A est coupable ou non, sont appels la barre. B est un ami de A et dira la vrit si A est innocent et mentira avec une probabilit 0,2 si A est coupable. C dteste tout le monde sauf le juge et dira la vrit si A est coupable et mentira avec la probabilit 0,3 si A est innocent. Ces conditions tant poses : a) Dterminer la probabilit davoir des tmoignages contradictoires. b) Quel tmoin a le plus de chances de commettre un parjure ? c) B et C ayant donn des tmoignages contradictoires, quelle est la probabilit que A soit innocent ? d) Les vnements (B ment) et (C ment) sont-ils indpendants ? 12) La diffrence essentielle entre les avions Airbus A 330 et A 340 est que le premier a deux moteurs et le second quatre. La probabilit quun moteur tombe en panne tant p]0, 1[, ces avions peuvent continuer leur route si au moins la moiti des moteurs est en tat. tudier suivant p lequel des deux avions est le plus fiable. Faire la mme tude en supposant quun avion peut voler sans problme avec un seul moteur. 13) Dans un bassin se trouvent 36 poissons dont x blancs (x entier compris entre 1 et 17), autant de noirs, les autres tant rouges. On tire simultanment 3 poissons du bassin et on appelle A lvnement les trois poissons sont de couleurs diffrentes . a) Dfinir lespace probabilis, en introduisant ventuellement des hypothses supplmentaires. b) Dans le cas x = 6 , calculer la probabilit de A. c) Etudier sommairement les variations de la fonction f dfinie par :

Rx 1, + 17 | Sf ( x) = 36x | T

2x3

d) Si p(x) est la probabilit dobtenir trois poissons de couleurs diffrentes, dterminer la valeur de x pour laquelle p(x) est maximale. e) Dans le cas x = 12, on note X le nombre de poissons rouges parmi les trois. Dterminer la loi de X. Calculer les probabilits p(A | X = 1) et p(X=1 | A) (corrig page 69 ) 14) Une loterie annonce : Un billet sur trois est gagnant, achetez trois billets ! . Alors ?

15) Un d pip est (mal) quilibr de telle manire que la probabilit de chaque face est proportionnelle au numro. Calculer les probabilits de chaque face. On lance deux ds et on note X la somme des deux rsultats. Quelle est la valeur de X la plus probable ? 16) Un appareil est constitu de 50 composants en srie dont la probabilit de dfaillance est p. a) Quelle doit tre la valeur de p pour que le risque de panne du systme soit infrieur 1% ? b) On n'a pas pu obtenir mieux que p = 5. 10-4. Calculer la probabilit de fonctionnement de l'appareil. c) Pour atteindre 0,99 on a l'ide de mettre en parallle deux appareils avec commutation automatique en cas de panne du premier. Quelle sera la probabilit de fonctionnement du dispositif ?

17) Dans le diagramme ci-contre, chaque reprsente un lien de communication. Sous la politique de maintenance, les dfaillances des liens sont des vnements indpendants, et on suppose qu chaque
page 12

UV SQ 20

instant, la probabilit quun lien fonctionne est p. a) Si on prend un instant au hasard, quelle est la probabilit que : exactement deux liens fonctionnent le lien g et un autre lien fonctionnent b) Sachant que six liens sont en panne, quelle est la probabilit que A soit encore en communication avec B ? 18) On tire simultanment cinq cartes dans un jeu de 32 (4 couleurs , , , , et 8 valeurs, As, R, D, V, 10, ..., 7). Calculer les probabilits des vnements suivants: on a au moins un As on a au plus un , on a une dame et un toutes les cartes sont de mme couleur toutes les cartes sont de valeurs diffrentes on a une seule paire Un joueur de poker a reu 5 cartes dont deux as, met de ct les trois autres cartes, puis reprend trois cartes dans le jeu. Calculer les probabilits des vnements: il a trois as il a au moins trois as il a un seul as il retire trois cartes de mme valeur. 19) Un ptissier confectionne des pains aux raisins de 50 g. Combien de raisins secs doit-il mettre dans 10 kilos de pte pour quen moyenne 95% des pains aux raisins contiennent au moins deux raisins ? 20) Un chariot est partag entre 3 machines A, B et C. Au dpart la machine est en A, et chaque tape de la production le chariot passe de manire alatoire une autre des deux autres machines. A la nme tape on note a n , b n et c n (a 0 = 1, b 0 = 0 et c 0 = 0) les probabilits que le chariot se trouve en A, B et C. a) Calculer ak , bk et ck pour 1 k 2 et les relations entre a n +1 , b n +1 et c n +1 et a n , b n et c n . a) En dduire a n , b n et c n en fonction de n et les limites quand n tend vers linfini. (corrig page 69)

21) 22) On considre une bote contenant 10 boules blanches numrotes de 0 9, ainsi que 5 noires numrotes de 1 5 et 5 rouges numrotes de 1 5. a) On tire successivement trois boules de la bote, sans les remettre dans la bote aprs tirage. Calculer les probabilits des vnements suivants: A = les trois boules sont de mme couleur B = les trois boules sont de couleurs diffrentes C = les trois boules ont le mme numro D = le nombre form par les trois rsultats est pair b) On tire simultanment trois boules de la bote. Calculer les probabilit des vnements suivants: A = les trois boules sont de mme couleur B = les trois boules sont de couleurs diffrentes C = les trois boules ont le mme numro D = il y a plus de boules noires que de blanches c) On tire successivement des boules de la bote, en les remettant dans la bote aprs tirage. Calculer les probabilits des vnements suivants: A = les trois boules sont de mme couleur (n = 3) B = les trois boules (n = 3) sont de couleurs diffrentes C = les trois boules (n = 3) ont le mme numro D = on a tir 4 boules avant d'en avoir une noire
page 13

SQ-20 Probabilits - Statistiques

-VII- Pour les linguistes:


1) Estn dispuestos tres desperados A, B y C en tringulo equiltero, en una plaza de toros, quizs con un carilln en el centro, firmemente decididos a disparar unos a otros. A es el menos diestro y alcanza la meta una de cada dos veces. B lo hace un poco mejor y la probabilidad que tiene de acertar es de 0,7. En lo que respecta a C, nunca falla. Disparan uno despus de otro siguiendo el orden A, B, C, A, B hasta que no quede ms que uno. Qu tiene que hacer A para empezar ?

page 14

UV SQ 20

Chap.2

Variables alatoires discrtes

-I- Variables alatoires:


Le rsultat dune exprience alatoire peut souvent se reprsenter par un nombre rel, le lancer dun d, la taille dun tudiant ou la temprature le matin 8 heures en un lieu donn. Il est donc plus simple de considrer le rsultat numrique au lieu dtudier lexprience en entier, quand cest possible. Prenons le lancer dune pice, quilibre ou non. On peut ne considrer que la face visible de la pice une fois que celle-ci sest immobilise. Mais on peut aussi tudier sa position au moment du lancer, limpulsion donne, sa trajectoire, son temps de mouvement et bien dautres variables, ce qui nous donne un univers dune complexit telle quil devient impossible de se livrer des calculs sur tous les paramtres dans un temps raisonnable. De cette exprience on ne retiendra que le rsultat final par exemple 1 pour Pile et 0 pour face. Suivant la forme du rsultat numrique, on pourra faire des tudes diffrentes. Lensemble des rsultats X() pourra tre un ensemble discret, fini ou non, ce qui sera lobjet de ce chapitre, ou continu, intervalle ou runion dintervalles (dintrieurs non vides) que nous tudierons au prochain chapitre. Quelques exemples pour bien faire la diffrence entre les deux cas : Nombre de Pile pour n (n>0) lancers dune pice X() = {0, 1, , n} Nombre dessais jusqu obtention dun succs dans une exprience alatoire X() = N* Taille dun tudiant en cm X() = [50, 250] Temps dattente avant panne dun systme X() = [0, [ 1) Mise en place Soit un espace probabilis (, A , p) et une application X de dans R. On dira par dfinition que X est une variable alatoire si : A R , X 1 (A ) A . En dfinissant la probabilit pX() sur X() par A R , p X ( ) (A ) = p X 1 (A ) on effectue un transfert de probabilit
de sur lensemble image X(). Pour des raisons de commodit, on identifie typographiquement les deux probabilits p et pX(). Cest un abus de langage car les deux espaces sont diffrents, mais il ne pose pas de problme dans la pratique. Cette dnomination de variable alatoire nest pas des plus judicieuses, en effet X nest pas une variable mais une application, et elle na rien dalatoire. On trouve aussi dans la littrature le synonyme alea numrique. 2) Variables discrtes Dans le cas o X() est un ensemble discret, X est, par dfinition, une variable alatoire discrte. Lensemble X() peut tre dans ce cas tre reprsent par une suite x1, x2, finie ou non. Les vnements lmentaires, disjoints deux deux, {xk, kN*} ont donc la probabilit pk, dfinie par p k = p / X( ) = x k

cl

qh et on a p
k N *

= 1, daprs la proprit de -additivit.

La probabilit totale 1 est donc distribue, pas ncessairement uniformment, entre les valeurs de X(). On appelle distribution (ou loi) de probabilit de la variable X lensemble x k , p k , k N * .

mb

Une variable alatoire tant donne, on dfinit aussi sa fonction de rpartition F, qui reprsente les probabilits cumules. En France, on dfinit F par x R , F( x) = p( X < x) , alors que pour les pays anglo-saxons lingalit est large. Pour une variable discrte, F est une fonction en escalier pour laquelle apparat une discontinuit
page 15

SQ-20 Probabilits - Statistiques

droite chaque point charg de probabilit. Cette fonction F est caractrise par les proprits suivantes (pour une variable discrte) : F 1. F est dfinie continue presque partout (= sauf sur un ensemble discret) de R dans [0, 1] F 2. F est croissante au sens large, cest dire ( x, y) R 2 avec x < y, F( x) F( y) F 3. lim F = 0 et lim F = 1
x x

A toute variable alatoire, on peut donc associer une distribution, puis une fonction de rpartition, et inversement, une fonction F remplissant les conditions F 1 F 3 ci-dessus on peut associer une distribution de variable alatoire avec la probabilit x R , p( X = x) = lim F( x) lim F( x)
tx + tx

3) Reprsentations graphiques Pour avoir une reprsentation visuelle dune distribution de probabilit, ou pour faire des comparaisons de lois, il peut tre intressant deffectuer une reprsentation graphique de la distribution ou de la fonction de rpartition. Pour la premire on reprsentera la distribution par un diagramme en btons, alors que pour la seconde on a une fonction en escalier.
tude dun exemple : On considre un jeu de 32 cartes dans lequel on prlve simultanment 5 cartes (une main), et la variable alatoire X = nombre dAs parmi les cinq cartes. Le tirage des cinq cartes tant simultan, il seffectue sans remise, et lordre de tirage est indiffrent. Une main est un sous-ensemble de cinq lments dans les 32 possibles. Moyennant une bijection, on peut travailler sur lensemble E = {1, 2, , 32}. Lespace probabilis, si on suppose que les cartes sont toutes quiprobables, scrit =

e onx , K, x s, x l1,K, 32q et i j x x t, P (), pj, avec Card() = C


1

5 32

.
p(X=k)= 0,488 0,407 0,098 0,008 0,000

On a donc, daprs lhypothse dquiprobabilit, les calculs suivants :

k 0, K , 4 p( X = k ) =

C C C5 32

k 4

5 k 28

, avec les rsultats numriques ci-contre :

Dans le calcul de cette probabilit, on tire k As parmi 4, puis 5-k cartes (diffrentes des As) parmi 28. Les tirages des As et des autres cartes tant indpendants, on peut utiliser la rgle de multiplication, les tirages pouvant tre reprsents par un arbre.

k= 0 1 2 3 4

-II- Moments dune variable alatoire


Plusieurs variables discrtes tant dfinies sur le mme espace, ou sur des espaces de mme nature, il peut tre pratique de disposer de moyens permettant de les comparer. Par exemple, si on considre deux populations vivant dans deux pays diffrents, la comparaison des tailles est difficile si on ne regarde que les donnes brutes ou mme les distributions. Il faudrait dfinir en quelque sorte un rsum simple de ces distributions des fins de comparaison rapide. Par analogie avec la mcanique, pour une variable discrte, on peut dfinir les moments dune variable. La dfinition sera un peu diffrente pour les variables continues que nous tudierons au prochain chapitre. 1) Dfinition gnrale : Une variable X tant dfinie sur un espace probabilis (, A , p), on appelle moment dordre n (nN*) lexpression M n ( X) = x n p( X = x k ) si cette expression existe. k
x k X ( )

On dfinit de mme les moments par rapport un rel , par M n , ( X) =

x k X ( )

(x

) n p( X = x k )

Dans le cas dune variable discrte support fini (X() est un ensemble fini) lexistence des moments est automatiquement assure, comme somme finie de nombres rels. Par contre si le support est infini dnombrable, le moment dordre n est la somme dune srie, qui nest pas ncessairement convergente. Dans ce dernier cas, il est possible que certains moments existent alors que pour dautres les sries
page 16

UV SQ 20

sont divergentes.
Par exemple, soit la variable X dfinie par sa distribution : n N * p ( X = n) =
n
3

. La srie tant conver-

gente, on peut dterminer > 0 tel que la somme des probabilits soit gale 1. Si on calcule les moments :
M1 ( X) =
n N

n
*

existe mais M 2 ( X) =

n N

n n' existe pas


*

2)

Esprance mathmatique : Soit un espace probabilis (, A , p) et X une variable alatoire discrte, on dfinit lesprance mathmatique E(X) par : E( X) = x k p( X = x k ) , si cette somme existe. Lesprance est donc le mox k X ( )

ment dordre 1 (par rapport 0). Dans la mesure o des points xk, affects des coefficients p(X = xk).

x k X ( )

p( X = x

) = 1 , lesprance est le barycentre

Pour expliquer cette dfinition, considrons une variable X valeurs dans X( ) = x1 , x 2 , K et N un entier trs grand. Lexprience tant faite N fois, le rsultat xk sera obtenu environ nk = N p(X=xk) fois, et n (N) 1 la moyenne des rsultats sera x ( N ) = lim x k n k ( N ) avec p( X = x k ) = N kN , de plus, quand N N x X ( )
k

tend vers +, on a E ( X) = lim x ( N ) .


N

Ceci donne donc une interprtation pratique, et une justification, de lesprance, moyenne des rsultats quand le nombre dexpriences tend vers linfini. En statistique, on appelle souvent lesprance moyenne, ce qui est une confusion entre un rsultat thorique, lesprance, et un rsultat calcul partir dune observation. Jusqu maintenant les statisticiens (et les tudiants) ont sans scrupules mlang les deux notions, mais sans dommage majeur.

Pour avoir une reprsentation plus concrte de lesprance, on peut faire une comparaison avec la mcanique, en considrant un systme de points matriels aligns dabscisses xk, et de masses p(X = xk). Lesprance est alors le centre de gravit du systme. 3) Variance Gnralement lesprance, si elle existe, nest pas suffisante pour comparer deux distributions. Lesprance donne en quelque sorte un centre dinertie, mais ne donne aucune indication de la dispersion de la distribution autour de ce centre. Imaginons par exemple que deux centres dexamens notent des copies. Il est possible que la distribution des notes aient la mme esprance mais que les rpartitions des notes autour de cette mme moyenne soient trs diffrentes. On dfinit la variance dune variable alatoire X ,discrte sur un espace probabilis (, A , p) et dont lesprance existe, par Var ( X) =
x k

bx

E( X) p( X = x k ) = E ( X E( X)) 2 , si cette somme existe,

cest dire le moment centr dordre 2. Cette dfinition montre lanalogie avec la mcanique, la variance correspond un moment dinertie, et elle permet de constater quune variance est toujours positive, comme barycentre de carrs affects de coefficients positifs, mais elle peut se mettre sous une autre forme, souvent plus pratique pour les calculs. 2 2 2 2 Var ( X) = x k 2 x k E ( X) + E ( X) p( X = x k ) = x k p( X = x k ) 2 x k E ( X) p( X = x k ) + ( E ( X) ) p( X = x k )

x k

x k

x k

x k 2

= =

x p( X = x
2 k x k

) 2 E ( X)
2

x p( X = x
k x k 2

) + ( E ( X))
2

p( X = x
x k

)=

x p( X = x
k x k

) 2 E ( X) + ( E ( X) )
2

x p( X = x
2 k x k

) E ( X) = E X

b g E ( X)

page 17

SQ-20 Probabilits - Statistiques

On prendra, au choix et suivant les circonstances, Var ( X) = E ( X E( X)) 2 = E X 2 E( X) en faisant bien attention la place des parenthses. Pour des raisons pratiques, on utilise aussi lcart type (cart quadratique moyen) dfini par la relation X = Var ( X) . La variance tant positive lexistence de lcart type est assure ds que Var(X) existe. 4) Relations sur lesprance et la variance On montre facilement, partir des dfinitions, que, et tant des nombres rels quelconques : E(X + ) = E( X) + , Var (X + ) = 2 Var ( X) et que X + =| | X . X E ( X) , de construire, x partir de X, une variable alatoire Y centre (desprance nulle) et rduite (de variance gale 1). Par contre, et cest un erreur frquente chez les tudiants distraits et fougueux, il nest pas question dutiliser une relation similaire si la relation entre X et Y nest pas affine. En particulier, et il est possi1 1 2 et E( X 2 ) E( X) , sinon toutes ble titre dexercice de trouver des contre-exemples, E X E ( X) les variances seraient nulles ! Si Var(X) 0, il est donc possible, moyennant la transformation affine Y =

h c h b

FG IJ H K

5) Exemples Si on reprend lexemple de la page 16, le calcul direct donne E(X) = 0,625 et Var(X) 0,48 , ce qui signifie que sur un trs grand nombre de tirages de 5 cartes, la moyenne du nombre dAs est de 0,625, environ. Exemple de variable support dnombrable, quon peut faire titre dexercice :
Dans une fourne de biscuits le nombre X de noisettes prsentes dans chaque biscuit est une variable alatoire de distribution : p ( X = k ) =
1 2

FI 3 H 3K

k N . On suppose de plus que la valeur dun biscuit est propor-

tionnelle au cube du nombre de noisettes prsentes (pourquoi pas ?). Les biscuits sont tris par des chimpanzs qui mangent tous ceux qui contiennent 0, 1 ou 2 noisettes. a) Calculer lesprance et la variance de X. b) Quelle est la probabilit quun biscuit pris au hasard soit mange par un chimpanz ? c) Quelle est la part du chiffre daffaires que les chimpanzs consomment ? d) Quelle est la probabilit quune noisette prise au hasard aille dans un biscuit en contenant k ? e) soit mange par un chimpanz ? On peut utiliser x 1, + 1

n=0

n x =
3 n

x x + 4x + 1
2

(1 x)

g ou dmontrer cette relation.

-III- Lois usuelles


Il nest pas question dtudier en dtail toutes les variables alatoires discrtes, il y en a une infinit, mais certaines dentre elles reviennent frquemment dans la pratique, et il est intressant den connatre les conditions dapplication. On peut aussi en mmoriser les caractristiques, distribution, esprance, variance quand elles existent. 1) Loi uniforme U(n) Soit lensemble En ={1, 2, , n}, nN* et la variable alatoire X uniforme sur En , cest--dire 1 quon suppose lquiprobabilit sur En. On a donc k E n p( X = k ) = . Il sagit de ce quon nomme n tirage au hasard dans le langage commun.
page 18

UV SQ 20

Calcul de lesprance et de la variance : E( X) = k


k =1

1 1 n( n + 1) n + 1 = = 2 2 n n

1 ( n + 1) 1 n( n + 1)(2 n + 1) ( n + 1) 2 n 2 1 = = 4 6 4 12 n n k =1 On remarque que si n = 1, la probabilit est concentre sur la valeur 1 et que la variance est nulle. Var ( X) = k 2
n 2

2) Loi binomiale B(n, p) Une situation frquente consiste rpter la mme exprience menant un succs (probabilit p) ou un chec (probabilit 1 p) n fois et compter le nombre X de succs. Il peut sagir par exemple de lancer 10 fois un d quilibr et de compter le nombre de 6, de tirer 5 flchettes sur une cible et de compter le nombre de flches dans le rond central. On peut aussi se rfrer la planche de Galton introduite la page 5, en prenant succs = droite et chec = gauche. Dans la pratique, on considre, pour ce genre dexpriences, que tous les lancers se font de manire indpendante, cest dire que les conditions de lexprience sont identiques dune fois lautre, il ny a pas dusure, de progrs dans la dextrit, etc. Une situation similaire (mais quivalente uniquement dans le cas o Np est entier) est le tirage avec remise de n jetons dans un ensemble de N, Np jetons blancs et N(1p) noirs, avec NN* et p[0, +1]. X est alors le nombre de jetons blancs tirs. On a lensemble X()={0, 1, , n}, et pour toute valeur de k dans X() le rsultat scrit sous la forme dune suite (x1, xn) de n lments parmi lesquels il y a k fois le rsultat 1 (succs) et n k fois 0 (chec). La probabilit dun tel rsultat est donc pk(1p)n-k. Pour construire une telle suite, il faut choisir k rangs o placer les 0 dans {1, 2, , n}, cest--dire C k possibilits. n k k n k On a donc k 0,K , n p( X = k ) = C n p (1 p) Les calculs de lesprance E(X) = np sobtient partir de la formule du binme. En effet :

E ( X) =

kC
k =0
n

k n

p (1 p )
k

nk

=p

k k !( n k )! p
k =1

n!

k 1

(1 p )

nk

= np

C
k =1

k 1 n 1

k 1

(1 p)

n 1 ( k 1 )

= np ( p + (1 p ))

n 1

= np

De mme pour la variance :


Var ( X) =

k2 C
k =0

k n

p (1 p)
k

nk

( np) =
nk

k ( k 1) k !( n k )! p
k =2

n!

k 1

(1 p )

nk

kC
k =1

k n

p (1 p)
k

nk

n p

2 2

= n ( n 1) p

C
k =0

k n2

k 2

(1 p)

+ E ( X) n p = n p np + np n p = n p (1 p)

2 2

2 2

2 2

3) Loi hypergomtrique H(N, n, p) a) Dfinition Pour la loi binomiale, on considre des tirages indpendants (avec remise), mais cette fois on tire les jetons simultanment, cest--dire quon ne remet pas les jetons dans la bote aprs tirage et que lordre de tirage na pas dimportance. Pour modliser ce problme, on peut considrer une bote spare en deux cases contenant respectivement N p jetons blancs et N(1p) noirs. Le nombre de tirages possibles, quon suppose quiprobables est alors C n . N Pour toute valeur de k dans {0,1, 2, , n}, on extrait simultanment k jetons dans la premire case, et ensuite (de manire indpendante) n k jetons dans la seconde. On a alors : C k C n-k nb de tirages des jetons blancs = C k Np N(1-p) Np . donc k 0, 1, K , n p( X = k ) = n-k n nb de tirages des jetons noirs = C N(1-p) CN Cette relation caractrise la loi hypergomtrique H(N, n, p).

Ne pas oublier la convention sur les combinaisons introduite la page 5. Le cas n = 0 ne prsente pas dintrt, car on ne tire pas de jeton et donc p(X = 0) = 1.

b) Proprits Par des calculs (fastidieux) sur les combinaisons, on vrifie que la somme des probabilits est bien
page 19

SQ-20 Probabilits - Statistiques

Nn . N 1 On remarque que lesprance est la mme que pour les tirages avec remise (variable binomiale), mais Nn que la variance est infrieure, avec toutefois lim np(1 p) = np(1 p) . n N 1 Nous allons faire le premier calcul titre dexemple, les autres feront (ventuellement) lobjet dun exercice qui pourra remplir une soire pluvieuse. Considrons n et N entiers tels que 0 < n N. gale 1, et on montre que E(X) = n p (rsultat indpendant de N) et Var ( X) = np(1 p)
x R , 1 + x Cn = N

a f = a1 + xf a1 + xf
N Np n i Np k =0

N ( 1 p )

Ck = N
k =0

FG C H
Np i=0

i Np

IJ FG C IJ . Considrons le terme en x KH K
N ( 1 p ) j N ( 1 p ) j= 0

i + j= n

j k C N (1 p ) = C k C n (1 p ) , ce qui montre que Np N

p(X = k) = 1
k=0

c) Exemples Soit un jeu de 32 cartes (4 couleurs , , , , et 8 valeurs, As, R, D, V, 10, ..., 7), duquel on extrait simultanment 5 cartes, ce quon appelle une main. On sintresse au nombre de reus dans les cinq cartes. Toutes les conditions seront remplies pour utiliser la loi hypergomtrique quand nous aurons suppos que les cinq cartes sont tires au hasard, cest--dire que toutes les mains possibles sont quiprobables. On a donc les paramtres N = 32, n = 5, et p = 0,25. (Cf. aussi lexemple -I- 3) page 3) 4) Loi gomtrique G(p) On considre la situation suivante : un vnement a une probabilit de succs de p]0, 1[. On rpte la mme exprience jusqu obtention dun succs, et on note X le nombre dexpriences effectues.
Par exemple les shadoks (feuilleton TV des annes 1960) avaient une chance sur 100 de russir leur exprience, alors ils essayaient jusquau succs. Nayant aucune connaissance de probabilits, ils se dpchaient de rater les 99 premires afin de russir coup sr la 100me . Exercice : avaient-ils raison ?

Plus srieusement, cette loi est utilise dans le domaine de la scurit. Pour tester la solidit dun matriel, on le soumet des chocs, ou des surtensions si cest un matriel lectronique, et on compte le nombre de chocs avant rupture. La variable X (variable gomtrique de paramtre p est dfinie n N * p( X = n) = p(1 p) n 1 o p]0, 1[. En effet, pour avoir le premier succs (probabilit p) la nme exprience, il faut avoir rat les n1 prcdentes (chacune de probabilit 1p). Toutes les probabilits sont positives, mais on doit quand mme vrifier que la somme des probabilits est gale 1. On peut faire la remarque que si une somme de rels positifs est gale 1, tous ces rels sont compris entre 0 et 1.

p( X = n) = p(1 p)
n N
*

n 1

=p

(1 p)
n N
*

n 1

p 1 (1 p )

=1

(somme dune srie gomtrique).

n N

Calculons maintenant lesprance, si elle existe. En utilisant le cours sur les sries entires, on peut montrer les rsultats suivants :
x ] 1,+1[ f ( x) = x n =
n N

1 1 x

, f ' ( x ) = n x n 1 =
n N

1 (1 x) = 1 p
2

et f " ( x) =

n N

n ( n 1) x
*

n 1

2 (1 x) 3

On a donc, avec x = 1 p,
E ( X) =
n N

np(1 p)
*

n 1

= p n(1 p) n 1 = p
n N
*

a1 (1 p)f
n 1

Var ( X) =

n N

n 2 p(1 p)
*

n 1

1 p
2

=p

n N

n( n 1)(1 p)
*

+p

n N

n(1 p)
*

n 1

1 p
2

2 p(1 p) p
3

1 p

1 p
2

1 p p2

5) Loi de Poisson P() a) Dfinition Soit une variable binomiale B(n,p) avec np = > 0, et tudions le cas o n tend vers linfini, ce qui implique, avec constant, que p tende vers 0. Il sagit donc, pour n assez grand, de rpter un grand
page 20

UV SQ 20

nombre de fois une mme exprience de probabilit faible. Pour kN on a :


lim p ( X = k ) = lim
n n n

car lim 1
n

F I H nK

F I F1 I k ! ( n k )! H n K H nK
n!
k n

nk

k ! n

lim

n ( n 1)K ( n k + 1)

= e , lim

n( n 1)K ( n k + 1) n
k

= 1 et lim 1
n

F I H nK

F1 I F1 I H nK H nK
n

e
k

k!

=1

On dfinit ainsi la loi de Poisson P() par son support X() = N et sa distribution p( X = k ) =

k e . k!

Cest une des manires de dfinir la loi de Poisson, mais elle nest pas entirement satisfaisante car cest une limite quand n tend vers linfini. En fait il y en a dautres, sans limites, que nous tudierons ultrieurement. Les impatients pourront consulter la partie relative aux relations entre variables alatoires la page 67.

b) Proprits Comme pour toutes les lois, il est recommand de vrifier que la probabilit totale est gale 1. Pour ce faire, on utilise les rsultats sur les sries entires :
On sait que x R,
n N

xn n!

= e x , donc p( X = n) =
n N n N

n e n!

= e e = 1

A partir de ce mme rsultat sur les sries, on peut aisment calculer lesprance et la variance :
E ( X) = n
n N

n e n!

=
n N

n 1 e ( n 1)!

= et Var ( X) = n( n 1)
n2

n e

n!

+n
n N

n e n!

= 2
n2

n2

( n 2)!

+ E ( X) 2 = 2 2 =

On remarque que cette loi est caractrise par lgalit de lesprance et de la variance, quon retrouve en faisant tendre n vers linfini, np restant constant, dans la loi binomiale. c) Exemples Dans la pratique, il nest pas question dattendre une situation o n est infini pour approcher la loi binomiale par la loi de Poisson. En prenant les cas o n 30, p < 0,1 et np 5, les rsultats sont assez proches avec les deux lois pour que lapproximation soit convenable.
On peut comparer les rsultats en traitant lexercice suivant : Une exprience a une probabilit 0,08 de russir. On la rpte n fois et on note X le nombre de succs. Etudier la loi de X, et dterminer son esprance et sa variance. On dcide maintenant d'effectuer 50 fois l'exprience. Dterminer la loi de X, et la probabilit d'avoir k succs pour k entier entre 0 et 5. Refaire les calculs avec une approximation binomiale et comparer les rsultats. Rponses : X suit une loi binomiale, lexprience tant rpte n fois dans les mmes conditions En comparant, pour n = 50, les rsultats avec la loi binomiale et la loi de Poisson, on obtient le tableau suivant Et on se rend compte que les rsultats sont assez prok= 0 1 2 3 4 5 ches pour pouvoir, dans la pratique, utiliser cette approxibinomiale 0,0155 0,0672 0,1433 0,1993 0,2037 0,1629 mation.
Poisson 0,0183 0,0733 0,1465 0,1954 0,1954 0,1563

6) Relations entre les lois : Pour des raisons pratiques, on approche assez souvent une loi par une autre, dans le but, les mathmaticiens sont paresseux, de simplifier les calculs. Il est dailleurs plus facile de manipuler les lois ayant peu de paramtres. Les approximations doivent rpondre certains critres pour tre acceptables. Tout dabord, on approche une loi par une autre de mme esprance, ou au moins ayant une esprance proche. Ensuite, pour le calcul des probabilits, il est inutile en gnral davoir plus de deux ou trois chiffres significatifs. On compare donc les probabilits des deux distributions, pour construire des rgles dapproximation, comme dans le paragraphe prcdent. Cest ainsi que si N est grand par rapport n ( partir de N 100 n) dans H(N, n, p) remettre ou non
page 21

SQ-20 Probabilits - Statistiques

les objets aprs chaque tirage na pas vraiment dimportance et on peut remplacer la loi hypergomtrique par une loi binomiale. Par exemple, un prlvement entre Audierne et la pointe de la Torche (15 kilomtres de plage) de vingt grains de sable pour compter ceux de diamtre infrieur un millimtre sera fait indiffremment avec ou sans remise. Par contre, compter le nombre dobjets dfectueux parmi dix prlevs simultanment dans une production de 30 units, fournira des rsultats sensiblement diffrents avec les lois binomiale et hypergomtrique. Dans la pratique, on utilise les approximations suivantes : Loi H(N, n, p)
N 10 n

Loi B(n, p)

n 30, p 0,1 et np 5

Loi de Poisson P( = n p)

-IV- Couples de v.a.


a) Dfinition Considrons maintenant deux variables alatoires X et Y dfinies sur le mme espace probabilis (, A , p). A tout lment on associe le couple (X(),Y()) R. Dans ce chapitre nous ntudierons que le cas o les deux variables sont discrtes, et par consquent lensemble X()Y() est discret, fini ou dnombrable. La distribution du couple (X, Y) est dfinie naturellement par p((X , Y)=(x , y)) = p((X=x)(Y=y)). On peut reprsenter cette distribution de probabiliX/Y yl y2 yp p(X = ) t sous la forme dun tableau, comme ci-contre, ou . dans un repre cartsien, o on affecte au point de x1 p11 p12 coordonnes (xn, yp) la probabilit pnp. x2 p21 Il est possible de connatre les distributions de X et de Y connaissant la distribution du couple (X, Y) xn pnp avec les distributions marginales par : p( X = x n ) = p ( X, Y) = ( x n , y k ) et de mme p(Y = ) 1 pour Y p(Y = y p ) = p ( X, Y) = ( x k , y p ) .
k
k

Cette terminologie vient du vocabulaire des comptables, qui, en vrifiant les tableaux de chiffres, effectuaient les totaux en lignes, quils inscrivaient dans la marge droite, puis en colonnes, et enfin le total de la dernire colonne qui devait correspondre avec le total de la dernire ligne. Dans le cas du tableau ci-dessus, le total de la dernire colonne (marge droite) est la probabilit totale, cest--dire 1.

b) Indpendance : Comme ont t dfinies les lois marginales on peut dfinir les lois conditionnelles. tant donn kN* tel que p(Y = yk ) 0, on dfinit la loi de X sachant (Y = yk) par les probabilits p ( X, y) = ( x n , y k ) et de mme pour Y. conditionnelles p( X = x n | Y = y k ) = p( Y = y k ) En utilisant lindpendance introduite page 7 on a la dfinition : X et Y sont indpendantes si et seu2 lement si ( n, p) N * p( X = x n Y = y p ) = p( X = x n ) p(Y = y p ) .

Il a t remarqu plus haut qu partir de la distribution du couple, on peut reconstruire les distributions de X et de Y. Linverse nest gnralement pas possible, sauf si on connat une relation entre X et Y, par exemple lindpendance. Dans ce cas, on remarque que les colonnes du tableau sont proportionnelles, ainsi que les lignes, ce qui permet de voir rapidement si les variables sont indpendantes ou non.

-V- Sommes de variables alatoires


page 22

UV SQ 20

a) Dfinition Avec les mmes hypothses que pour les paragraphes prcdentes on dfinit la variable alatoire Z, somme de X et de Y par Z = X + Y, avec la distribution z R , p( Z = z) = p ( X, Y) = ( x n , y p ) . Les variables tant discrtes, le support de Z est lensemble E Z = x n + y p , n N * , p N * .
Si on reprsente le couple (X, Y) dans un repre cartsien, toute valeur de z, on associe la droite squation x + y = z, et on somme les probabilits des points situs sur cette droite.

xn +yp =z

b) Exemples Le lancer de deux ds fournit deux rsultats X et Y compris entre 1 et 6, et la somme Z est une variable valeurs dans {2, , 12}. Si les distributions de X et de Y sont uniformes (et indpendantes) avec des ds quilibrs, celle de Z ne lest pas. Il est facile de voir que 1 1 p( Z = 2) = alors que p( Z = 7) = . Le nombre de pannes dans un systme pendant un intervalle donn suit souvent une loi de Poisson. 36 6 Si on considre deux types de pannes, par exemple X le nombre de pannes lectriques et Y le nombre de pannes mcaniques, on peut tudier le nombre total Z = X + Y. Si X et Y sont des variables de Poisson indpendantes de paramtres respectifs et , on a Z qui suit aussi une loi de Poisson, mais de paramtre + . En effet :
z N , p( Z = z) = = e
( +) z

p( ( X , Y ) = ( x , y ) ) = p ( X = x ) p ( Y = z x ) =
x+ y=z x=0 x=0 x zx

e
x

z x

x ! ( z x )!

z!

x !( z x)!
x=0

z!

( + )

( + ) z!

c) Stabilit : A la lumire des deux exemples prcdents, on peut se poser la question de la nature de la loi de Z connaissant celles de X et de Y. On dira quune loi est stable par addition si X, Y et Z sont de mme nature, ventuellement avec des paramtres diffrents. On montre, et ce sera tudi dans les exercices la fin de ce chapitre que les lois uniformes, gomtriques ne sont pas stables alors que les lois binomiales indpendantes de mme paramtre p, les lois de Poisson indpendantes (voir ci-dessus) sont stables. En particulier, si X est B(n,p) et Y B(m,p) indpendantes, alors Z = X + Y est B(n+m , p). d) Esprances et variances Au cours de la partie statistique, les sommes de deux ou plusieurs variables seront utilises abondamment, et il est utile de connatre les relations entre les esprances et variances et celles de la somme, pour viter de refaire tous les calculs. Avec les mmes notations, en supposant que les esprances existent on a :
E ( X + Y) = =
n

(x
n N p N
* *

+ y p ) p ( X, Y) = ( x n , y p ) =
p p

x pb( X, Y) = ( x
n n N
*

, yp ) +

p N

y pb ( X , Y ) = ( x
p p N
*

, yp )

n N

x p( X = x
n N
*

)+

y p(Y = y
p N
*

) = E ( X) + E ( Y)

En utilisant aussi le paragraphe -II- 4) page 18, on en dduit que lesprance est un oprateur linaire sur les variables alatoires. Cette relation est valable dans tous les cas, mme si les variables ne sont pas indpendantes. En ce qui concerne la variance, on na pas toujours une relation analogue. Par contre, si X et Y sont indpendantes, on a Var(X + Y) = Var(X) + Var(Y).

-VI- Exercices
page 23

SQ-20 Probabilits - Statistiques

1) Soit une variable alatoire X qui prend les valeurs entires entre 0 et 10 avec les probabilits : p( X = k ) = p k = a (10 k ) k . Dterminer a pour que p soit une probabilit. Calculer E(X) et Var(X). 2) Dans une urne il y a n boules numrotes de 0 n1. On tire lune aprs lautre, avec remise, 3 boules et on note X le plus petit numro et Y le plus grand numro. a) Dfinir lespace probabilis. Quelles sont les valeurs possibles de X et de Y. b) Pour x entier convenable, calculer les probabilit p(X < x) et p(Y < y). c) En dduire les probabilits p(X = x) et p(Y = y). (corrig page 70) d) Calculer E(X) et Var(X) dans le cas o n=10. 3) Soit X1, X2, ..., Xn des v. a. indpendantes de mme loi telle que E(X) = 15 et Var(X)= 12. a) Dterminer les esprances et les variances des lois suivantes : n 1 n Y1 = 10X1 , Y2 = X k , Y3 = X1 + X 2 avec ( , ) R 2 , Y4 = X k n k =1 k =1 b) Peut-on trouver une loi binomiale correspondant ces donnes (esprance = 15, variance = 12) ? 4) Un objet vendu sur le march peut contenir, avec la mme probabilit de 0 3 dfauts. La valeur marchande de lobjet (en ) est gale Y = 10 X, o X est le nombre de dfauts. Des tiquettes dun Euro sont colles sur chaque objet pour en indiquer la valeur. a) Quel est le prix moyen des objets ? b) Quelle est la probabilit quune tiquette prise au hasard soit colle sur un objet ayant 2 dfauts ? 5) Un tl cripteur transmet 2 000 caractres par minute. On estime 1/1 000 la proba lit derreur sur un quelconque de ces caractres. a) On appelle X le nombre derreurs commises pendant une minute. Etudier la loi de X. b) Dterminer la probabilit davoir moins de 5 erreurs dans un message de trois minutes. 6) Un reprsentant R fait du porte porte pour distribuer des chantillons de nourriture pour chiens. Il laisse un chantillon (une bote) si on rpond la porte (probabilit 0,75) et si il y a un chien dans la maison (probabilit 0,4). On suppose que les vnements la porte souvre et il y a un chien sont indpendants. a) Calculer la probabilit quil donne son premier chantillon la troisime porte. b) - - - - - deuxime chantillon la cinquime porte. c) Sachant quil a donn deux chantillons ses huit premiers essais, quelle est la probabilit quil donne son cinquime chantillon la onzime porte ? d) Sachant quil na pas encore donn son deuxime chantillon la deuxime porte, calculer la probabilit quil le donne la cinquime porte. e) Le reprsentant doit rechercher dautres botes aprs avoir puis son stock. Sil part avec deux botes, quelle est la probabilit quil assure au moins cinq portes avant de refaire son stock ? 7) Une entreprise pharmaceutique produit en grande srie des tubes de comprims dacide actylsalicylique dans trois usines A, B et C qui se partagent la production raison de 30% pour A et 20% pour B. La production, pour chacune des usines se rpartit en deux catgories : le march intrieur (60% pour A, 10% pour B et 40% pour C) et le march international. a) On prend un tube au hasard dans la production, dterminer les probabilits des vnements : E1 : Il est destin au march intrieur, E2 : Il vient de A sachant quil est destin linternational. b) On contrle 5 tubes dans A et on note X le nombre de ceux destins la France. Etudier la loi de X, et calculer p(X > 3). c) Le tubes produits en A ont une probabilit de dfaut (tube mal ferm, traces de chocs, ..) de 0,02 et sont empaquets par caisses de 200 units. Si Y est le nombre de tubes dfectueux par caisse, tudier
page 24

UV SQ 20

la loi de Y et calculer la probabilit davoir au maximum 5 tubes dfectueux dans une caisse. 8) Un chef d'entreprise, pour viter l'attente des camions devant livrer, envisage, si ncessaire, de construire de nouveaux postes de dchargement. Il y en a actuellement 5. On considre pour simplifier l'tude qu'il faut une demi-journe pour dcharger un camion. Une enqute pralable sur 60 jours a montr les rsultats suivants: 0 1 2 3 4 5 6 7 8 9 10 xi = nombre de camions ni = nb de demi-journes 2 10 18 22 23 19 12 7 4 2 1 a) Dterminer une loi de probabilit X reprsentant cette enqute. En calculer l'esprance et la variance. Comparer les probabilits celles donnes par une loi de Poisson de mme esprance. b) Quelle est la probabilit de n'avoir aucun camion en attente ? c) Combien faudrait-il de postes pour que cette probabilit soit suprieure 0,95 ? d) On prvoit l'avenir un doublement de la frquence des livraisons. Combien faudrait-il de postes pour que la probabilit de n'avoir aucun camion en attente reste suprieure 0,95 ? 9) Une variable alatoire X peut prendre les valeurs 1, 0 et +1 avec les probabilits a) Calculer E(X) et Var(X). b) Soit la v.a. Y lie X par les relations : 1 p Y = 0| X = 1 = 1 , p Y = 1| X = 1 = 2 , p Y = 1| X = 0 = 2 3 3
1 3 1 ,2,1. 6

1 3 , p Y = 1| X = 1 = 4 , p Y = 0| X = 1 = 4 Dterminer, sous forme de tableau, la loi du couple (X, Y), puis la loi de Y. Calculer les esprances de X et de Y. Les variables X et Y sont-elles indpendantes ? 1 2

b g pbY = 1| X = 0g =

10) Soit deux variables alatoires X et Y, indpendantes et de mme loi gomtrique de paramtre p. Pour 0 < p < 1, on note U = inf ( X , Y). a) Calculer, pour k entier , p(U > k). b) En dduire p(U = k) et reconnatre la loi de U. Calculer E(U) et Var(U). 11) Soit X et Y deux lois indpendantes uniformes sur E = {1, 2, ,n}, et leur somme Z = X + Y . a) Dterminer lensemble F des valeurs possibles de Z, puis, pour z F , p( Z < z ) . b) En dduire la distribution de probabilit de Z, ainsi que E(Z) et Var(Z).

12) Deux v. a. X et Y tant dfinies, le tableau ci-dessous donne la loi Y\X 1 2 3 4 de probabilit du couple (X, Y): 5 0,05 0,15 0,15 0,05 a) Dterminer les lois conditionnelles 7 0,1 0,15 0,05 0,1 b) Calculer E(X), E(Y), et comparer E(X)+E(Y) et E(X+Y) 9 0,15 0 0,03 0,02 c) Calculer Var(X) et Var(Y) ainsi que la covariance de X et Y d) Les variables alatoires X et Y sont-elles indpendantes ? 13) Le DRH dune entreprise doit embaucher une personne pour un poste dingnieur. Il convoque les candidats pour un entretien, et il sarrte quand il a trouv une personne qui lui convient. Les candidats ont chacun une probabilit 0,2 de convenir. a) On note X le nombre de candidats ayant subi un entretien. tudier la loi de X. b) Un candidat est le 5me sur la liste, quelle est sa probabilit davoir le poste ? c) Un entretien dure une demi-heure et la sance commence 8 heures. Quelle est la probabilit quelle soit termine avant midi ? d) On considre maintenant que lentreprise doit embaucher deux ingnieurs. La sance dentretiens se droule comme prcdemment, mais sarrte aprs le second candidat choisi. Si on note Y le nombre dentretiens, dterminer E(Y) et calculer p(Y = 10).

page 25

SQ-20 Probabilits - Statistiques

14) Un fabricant de cordes de montagne soumet des cordes de nylon de 12 mm des essais du rupture (une charge de 80 kg est lche depuis une hauteur de 5 mtres). Le test consiste rpter cet essai jusqu rupture de la corde et on suppose (ce qui dans la ralit nest pas tout fait exact) que la corde ne subit aucune modification si elle ne rompt pas. La probabilit que la corde casse au cours dun essai est p = 0,09. Soit X la variable alatoire : nombre dessais avant rupture. a) Dterminer la loi de X, donner son esprance et sa variance. b) Calculer les probabilits p(X > 4 ), p(X est pair) et p(X > 6 | X > 4 ). Pour quelles valeurs de n a-ton p(X n ) 0,99 ? c) Aprs rupture de la corde on continue le test avec une deuxime corde identique la premire et on dfinit ainsi une seconde variable alatoire Y de mme loi. Si on pose Z = X + Y (Nombre dessais avant la seconde rupture). Dterminer la distribution de probabilit de Z, ainsi que son esprance et sa variance. Calculer p(Z = 10) d) On considre un lot de 50 cordes de 12 mm et on dfinit la variable alatoire N = nombre de cordes ayant rompu au cours du premier essai. Dterminer la loi de N et calculer p(N < 5).
NB: Des essais pratiqus sur d'anciennes cordes de chanvre ont montr qu'elles cassent toutes au premier essai !

15)

** Soit X et Y deux v.a. valeurs dans N. X suit une loi de Poisson de paramtre . Si (X = n) est ralis, Y suit une loi B (n, p). tudier la loi de Y. (On remarquera que Y dpend de X, donc les lois ne sont pas indpendantes, et on pourra calculer les probabilits p(Y=0), p(Y=1) et ventuellement p(Y=3) et gnraliser).
On peut interprter ce problme de la manire suivante: Parmi les clients qui attendent un guichet, dont le nombre suit une loi de Poisson, certains, avec une probabilit p sont des gros clients (dont le temps de traitement est plus long que la normale), et dont le nombre suit une loi binomiale. (corrig page 71)

16) Deux systmes de contrle I et II sont soumis des pannes indpendantes. Les lois de probabilits du nombre de pannes (X pour I et Y pour II) sont donnes dans le tableau ci-dessous. Systme I x = p(X = x) Systme II y = p(Y = y) 0 0,07 0 0,10 1 0,35 1 0,20 2 0,34 2 0,50 3 0,18 3 0,17 4 0,06 4 0,03 a) Calculer les probabilits suivantes : Le systme II a au moins deux pannes par jour Il y a plus de pannes dans le systme I que dans le systme II Il y trois pannes dans la journe. b) Lquipe de techniciens ne peut rparer quun maximum de 5 pannes par jour. Au cours dune priode dun mois (de 30 jours) on note N le nombre de jours o lquipe de techniciens sera dborde. Etudier la loi de N, son esprance et sa variance et calculer p(N = 3 ). 17) Un atome radioactif met des particules en nombre alatoire. Soit X ce nombre pendant un intervalle de temps donn. Un observateur ne peut pas voir toutes les particules mises mais dtecte chaque particule mise avec une probabilit p ]0, +1[. Soit Y le nombre de particules observes pendant le temps considr. On suppose que X suit une loi de Poisson de paramtre . a) Quelle est la loi conditionnelle de Y sachant X = n. b) En dduire la loi du couple (X , Y). c) Montrer que Y suit une loi de Poisson de paramtre = p. d) Soit Z = X Y. Que reprsente Z, et quelle est sa loi ? e) Les variables Z et Y sont-elles indpendantes ? Et en ce qui concerne X et Y ?

page 26

UV SQ 20

Chap.3

Lois continues

-I- Dfinition
Dans le chapitre prcdent, nous avons tudi les variables alatoires valeurs discrtes, et nous allons considrer dans celui-ci des variables relles pouvant prendre toutes les valeurs dans un intervalle dintrieur non vide, ou une runion de tels intervalles. Les cas les plus frquents sont les variables telles que X() = R+ ou [a, b] avec a < b. Cest le cas par exemple du temps dattente avant un vnement (panne, gain au loto, ) ou dune mesure (taille, masse, distance, intensit lectrique, ). 1) Loi absolument continue

-II- Lois usuelles

-III- Loi normale


Cette loi a une importance telle quelle mrite quon lui accorde un paragraphe spcial.
Pour les tudiants ayant une mmoire trs limite, ou qui ont une concentration pointille en cours : Si on ne doit retenir quune seule variable alatoire dans toutes celles qui sont tudies, cest la variable normale. Alors pour ceux qui ont chroniquement du sommeil en retard, ce nest pas le bon moment pour faire une petite sieste dans lamphi !

-IV-

Couples de v.a.

-V- Fonction d'une loi:


1) Exemple, loi de Cauchy Soit X une variable uniforme sur un demi cercle de centre O, de rayon 1 et (D) la tangente verticale ce demi cercle. Une demi droite dorigine O et dangle X coupe D en un point M. On considre la vapage 27

SQ-20 Probabilits - Statistiques

riable Y = ordonne de M. On cherche dterminer la loi de Y. Soit f et g les densits de X et Y, F et G leurs fonctions de rpartition. On a alors :
X( ) =

OP Q

1 , et donc f ( x) = 1O L ( x) P 2 , 2 M 2 2 Q N

LM N

y R G ( y ) = p ( Y < y ) = p

FG H

1 1 < X < Arc tan( y) = Arc tan( y) + et donc g( y) = G '( y) = (1 + y 2 ) 2 2

IJ FG K H

IJ K

Cette densit dfinit la loi de Cauchy. Cette loi, quon retrouve dans quelques situations, a la particularit de ne pas avoir desprance (et videmment pas de va y dy riance) en effet son calcul mne lintgrale gnralise qui nest pas 2 (1 + y ) convergente.

X Y Z

2) Loi dune fonction dune v.a. : Soit X une v.a. relle continue de densit f et de f.r. F. Exprimer laide de f et F la densit gk et la f.r. Fk des Yk dfinies par : Y1 = aX + b (a > 0 , b R ) Y2 = X Y3 = X 2 Y4 = ln X

-VI- Exercices
1) Soit X la variable alatoire de densit: f ( x) =
si x 0 et f ( x) = 0 si x < 0 . ( x + 2)3 a) Dterminer pour que f soit effectivement une densit de probabilit. b) Calculer E(X) et p(X E(X)) ainsi que la variance, si ces lments existent.

2) Soit un point choisi au hasard dans un triangle de base l et de hauteur h. On dfinit la variable X comme la distance du point la base du triangle. Etudier la f. r. et la densit de X. 3) Lois des extrmes : Soit X1 , ..., X n des v.a. indpendantes de densit f et de f.r. F. On considre les v. a . S n = sup X i , 1 i n et I n = inf X i , 1 i n de densits g et h et de f.r. G et H.

a) Exprimer les vnements (In y) et (Sn < z) au moyen des Xi . En dduire g, h G et H. b) Calculer les densits et les esprances des lois In et Sn dans les cas : (C1 ) X i de densit f ( x) = 2 2 x sur [0, 1] 0 sinon (C2 ) X i de densit uniforme sur [0, 1] c) Si les Xi sont des v.a. uniformes sur [0, +1], calculer les limites de E(Sn) et de E(In) en +. 4) Soit la variable X dfinie par la densit f ( t ) =

a t2

1+ t2

1R + ( t ) .

a) Pour quelle valeur de a f est-elle une distribution de probabilit. Calculer E(X) et Var(X). b) On appelle mdiane (ou deuxime quartile) le nombre me tel que p(X < me) = 0,5. En calculer une valeur approche (en utilisant au besoin la calculatrice).
page 28

UV SQ 20

c) On appelle mode (il n'est pas ncessairement unique) le nombre mm tel qu'en mm la densit de probabilit est maximale. A-t-on E(X) = me = mm ? 5)

tant une constante positive. X suit alors une loi de Rayleigh. a) Dterminer sa densit de probabilit ainsi que son esprance. b) Calculer sa mdiane Me (dfinie par p(X < Me) = 0,5) et son mode (valeur pour laquelle la densit est maximale). c) Application (avec incursion dans le programme de MT 25) : Une cible est centre sur lorigine r r dun repre O, i , j orthonorm. Une flchette est lance sur cette cible, et on suppose que les coor-

R | si x 0 , a (*) Soit la variable X dont la fonction de rpartition est donne par: F( x) = S1 e |0 si x < 0 T
x2 2a2

donnes dimpact X et Y suivent des lois normales centres rduites indpendantes. Dterminer la fonction de rpartition H(d) et la densit h(d), de la variable alatoire Z = distance du point dimpact au centre. 6) On prend au hasard un point M lintrieur d'un quart de cercle trigonomtrique, et on note Z = ( X , Y), o X et Y sont les coordonnes de M. a) En supposant la distribution uniforme, dterminer la densit h(x , y) de Z. b) Dterminer les fonctions de rpartitions F et G et les densits f(x) et g(y) des lois marginales. c) Etudier les lois conditionnelles Y | X = x, pour x [0,+1] et X | Y = y pour y [0,+1]. d) X et Y sont-elles indpendantes ? 7) Soit X une variable exponentielle de paramtre . Dterminer la loi de probabilit de la variable Y = Ent(X+1) cest--dire la partie entire de X+1. a) Dterminer, pour k N* , p(Y = k). En dduire la nature de la loi de X b) En calculer lesprance. 8) La dure de vie, en semaines, d'un composant lectronique dfinit une variable alatoire exponentielle X. On a constat que 95,12 % des composants taient encore en tat de marche au bout de 25 semaines. a) Montrer que cette constatation permet de fixer 0,002 le paramtre de cette loi. b) Calculer l'esprance de cette loi.
(Remarque: en fiabilit cette esprance est appele M.T.B.F. ou Moyenne des Temps de Bon Fonctionnement, ou Mean Time Before Failure)

c) Quelle est la probabilit, pour un de ces composants d'tre en tat de marche au bout de 100 semaines. d) Sachant qu'un composant a bien fonctionn pendant 100 semaines, quelle est la probabilit qu'il soit encore en fonctionnement au bout de 200 semaines. e) On construit un appareil avec 10 de ces composants monts en srie. Le temps de bon fonctionnement, en semaines, de l'appareil est une nouvelle v.a. Y. Dterminer p(Y 50). 9) Un test de production normalis utilise une variable N(150,=36) a) Dresser la reprsentation graphique de la densit. b) Dessiner chacune des probabilits par une surface sous la courbe de densit, et calculer les probabilits que les rsultats Soient plus petits que 140 Soient plus grands que 175 Soient plus petits que 200 et plus grands que 130. Soient compris entre 114 et 190. c) Dterminer le premier dcile et expliquer ce quil signifie.
page 29

SQ-20 Probabilits - Statistiques

d) Le test de production est appliqu 49 personnes indpendantes. Quelle est la probabilit dobserver une valeur moyenne infrieure 140. Comparer ce rsultat avec celui du b) 1 . Comment expliquer la diffrence ? 10) Un laboratoire fabrique des pilules se composant de deux substances A et B. Pour chaque pilule on considre les masses X et Y des substances A et B. On suppose que X et Y sont des variables normales indpendantes N(Mx= 8,55, X= 0,05) et N(MY = 5,20, Y = 0,05). a) On impose une normes de fabrication 8,45 < x < 8,70 et 5,07< y < 5,33. Dterminer le pourcentage de pilules qui sont hors norme. b) Peut-on retenir ce procd de fabrication, sachant que le pourcentage de pilules dfectueuses ne peut dpasser 1 % ? 11) Une machine fabrique des lentilles pour systmes optiques dont le diamtre est une variable alatoire D normale d'esprance 32 et d'cart type 0,8 (unit 1 mm). a) Les lentilles sont refuses si leur diamtre est infrieur 30,5 ou si il est suprieur 33 mm. Dterminer le pourcentage de rebut dans la fabrication. b) Les meilleurs lentilles, c'est dire les 20% les plus proches de la moyenne sont rserves l'industrie photographique. Dans quel intervalle leur diamtres est-il situ ? machine est dclare bien rgle si la probabilit c) La d'avoir des pices de diamtre suprieur 34,3 mm est inLa recette du plat de lentilles frieure 0,04. La machine est-elle bien rgle ? d) Une pice tant prleve au hasard parmi celles qui ne sont pas refuses, avec quelle probabilit son diamtre est-il compris entre 31,5 et 32,5 mm ? 12) Soit X une variable normale d'esprance 100 et de variance = 16. a) Dterminer les quartiles de cette loi, c'est dire les nombres a, b et c tels que: p(X<a) = 0,25 , p(X<b) = 0,5 , p(X<c) = 0,75 . b) On dfinit de la mme manire les dciles, c'est dire les nombres ak , k{1, 2, , 9} vrifiant p(X<ak) = 0,1 k. Calculer les neuf dciles de la loi X. Soit X une variable normale desprance m=1,8 et de variance = 0,01. On dfinit les variables 40 S X k et X = avec X1 , X 2 ,K , X 40 tant une suite de variables alatoires alatoires Y = 40X, S = 40 k =1 indpendantes de mme loi que X.

13)

a) Dterminer les esprances de Y, S et X . Il est possible de reprsenter les rsultats sous forme de tableau. b) Calculer p(1,7 < X < 1,9), et dterminer > 0 tel que p(1,8-< X < 1,8+)=0,95. c) Calculer p(68 < Y < 76), et dterminer > 0 tel que p(72-< X < 72+) = 0,95. d) Calculer les probabilits p(68 < S < 76) e) Dterminer >0 et tels que p(72 < S < 72 + ) = 0,95 et p(1,8 < X < 1,8 + ) = 0,95 . 2 2 2 f) Calculer les rapports 2 , 2 et 2 . Existe-t-il des relations entre , , et ? 14) Le prix quotidien du logement dans des terrains

page 30

UV SQ 20

de camping suit une loi normale desprance M = 11,5 et de variance = 1,8. Un vacancier part camper 30 jours avec un budget de 360 Calculer la probabilit de lvnement le budget est suffisant dans les cas suivants : a) a) Il passe toutes ses vacances dans le mme terrain b) b) Il change de terrain de camping tous les jours. 15) Soit le domaine (D) = intrieur du triangle OAB o O est lorigine dun repre orthonorm, A et B de coordonnes (1, 0) et (1, 1). On dfinit sur (D) un couple de variables alatoires (X, Y) par sa densit : k ( x, y) = si ( x, y) ( D) et 0 sinon. xy a) Dterminer la constante k pour que soit effectivement une densit de probabilit. b) Dterminer les lois marginales, de X et de Y. Les variables X et Y sont-elles indpendantes ? c) Calculer p(Y<0,5 |X<0,75). 16) Un systme lectronique est pilot par un circuit intgr dont le temps de fonctionnement exprim en semaines suit une loi exponentielle de paramtre = 0,005. Pour des raisons de maintenance, ce circuit est doubl par un second identique au premier, qui se met en marche ds que le premier tombe en panne. On note X la dure avant arrt du systme. a) Dterminer la loi de X. b) Dterminer la probabilit de fonctionnement du systme pendant un an. 17) Deux quipements techniques A et B fonctionnent indpendamment l'un de l'autre. Ils ont des dures de vie X et Y exponentielles de paramtres = 1 et = 2. a) Dterminer la densit h(x,y) du couple (X,Y). b) Dterminer la probabilit que A tombe en panne avant B. 18) Un quipement est form de n lments identiques monts en srie. Les dures de vie de ces lments suivent une loi exponentielle de paramtre . a) Etudier la loi T = dure de vie du systme, fonction de rpartition, densit. b) Calculer en fonction de n et de la dure de vie moyenne E(T). Calculer ensuite la variance de T. c) Application numrique : = 0,1 et n = 20. 19) Un problme de rencontre. Deux tudiants A et B doivent se rencontrer la caftria entre midi et 13 h. Chacun deux a indiqu quil nattendrait pas plus de 10 minutes. On suppose quils arrivent indpendamment lun de lautre des instants au hasard (loi uniforme) entre midi et 13 h. a) Quelle est la probabilit de la rencontre ? b) A arrive linstant x (x[0,+1]), dterminer en fonction de x la probabilit de la rencontre. c) A arrive linstant x, et B nest pas l. Dterminer en fonction de x la probabilit de la rencontre. 20) Chaque jour, quand il quitte la maison pour aller au casino, Oscar fait tourner une roue de la fortune pour dterminer la somme quil emporte avec lui. Il emporte X centaines d , o X est une v. a. continue de densit f, dfinie x f ( x) = 1[ 0, +4 ] ( x) . Pour des raisons pratiques, 8 on supposera que la monnaie est indfiniment divisible (arrondir au centime le plus proche ne ferait pas une grosse diffrence). Oscar sait, aprs des annes de pratique, quil ne gagne jamais. En fait,
page 31

SQ-20 Probabilits - Statistiques

la somme quil rapporte chez lui la fin de la journe, quon note Y, est une variable uniforme sur [0, x], x tant la somme de dpart. a) Dterminer la densit (x,y) du couple (X, Y) b) Dterminer la probabilit marginale g(y) = densit de la somme quil rapporte chez lui. c) Calculer lesprance de gain doscar pour une journe. d) Un jour donn, on apprend quOscar est rentr chez lui avec moins de 200 . Dterminer les probabilits des vnements suivants : Il est entr dans le casino avec moins de 200 . Il a eu moins de 100 de pertes. Ses pertes slvent exactement 75 . 21) Soit une variable alatoire X normale N(0,1). Dterminer la loi de Y = e X .
Remarque: Cette loi, appele loi de Galton ou loi log-normale, a des applications dans l'tude du morcellement. La rpartition des tailles des grains d'un mme produit, particulirement prpar par broyage (graviers, poudres de mtaux ou de cristaux) suit, sous des conditions trs gnrales, une loi de Galton.

-VII- Problmes
Problme 1:
Lien entre la loi exponentielle et la loi de Poisson: Le temps de fonctionnement X avant panne d'une machine suit une loi exponentielle de paramtre . On suppose que les pannes successives sont indpendantes. On note X1, X2 , K et Xn les temps de fonctionnement avant panne de la machine et Zn = X1 + X2 +K+ Xn le temps de fonctionnement avant la nme panne. Zn est une loi (absolument continue) de densit fn et de fonction de rpartition Fn. a) Dterminer la densit et la fonction de rpartition de Z2. n t n1 e t b) Montrer par rcurrence que: fn ( t ) = ( n 1)! c) En dduire Fn ( t ) = n (t ) avec n ( x) =
1 ( n 1)!

t 0,+

u n 1e u du .

d) On considre le nombre de pannes Y pendant une dure T>0. Dterminer la loi de Y. e) Application numrique: Une voiture a une crevaison en moyenne tous les 20 000 kilomtres. On prvoit un voyage de 50 000 kilomtres. Quelle est la probabilit de pouvoir faire le voyage avec la seule roue de secours ? Combien doit-on emporter de roues de rechange (en plus de la roue de secours) pour pouvoir terminer le voyage avec une probabilit suprieure 0,95 ?

page 32

UV SQ 20

Chap.4

Convergences

-I- Fonctions caractristiques usuelles:


1) La variable alatoire discrte X prend les valeurs 0, 1 et 2 avec les probabilits 0,5 , 0,25 et 0,25. Calculer la fonction caractristique X(t), puis les valeurs X (0) , ' X ( 0) et "X (0) . En dduire lesprance et la variance de X. 2) On rappelle que la loi de Pascal (loi gomtrique) de paramtre p est dfinie de la manire suivante: on rpte une exprience menant un succs (probabilit p) ou un chec dans les mmes conditions jusqu obtention dun succs. On note X le nombre dexpriences ncessaires. a) Dterminer la distribution de probabilit de X. b) Dterminer sa fonction caractristique et en dduire lesprance et la variance. 3) Soit X une v.a. de Poisson P () de paramtre > 0. a) Ecrire la fonction caractristique de X. b) En dduire la fonction caractristique Y(t) de la v.a. Y dfinie par: Y = c) Etudier la limite de Y(t) quand tend vers l'infini.

X .

-II- Ingalits
1) Au cours d'une preuve un vnement a une probabilit 0,2 de se raliser. a) On effectue n preuves indpendantes. Si X est le nombre de fois o l'vnement se ralise, dterminer la loi de X, son esprance et sa variance. b) Montrer que par la loi de X (pour n=100) p(15 X 25) est gale 0,832 0,001 prs Calculer cette mme probabilit: 1. par l'ingalit de Bienaym-Tchebitcheff 2. en approchant la loi de X par une variable normale. c) Calculer, pour n = 1 000, p(170 X 230) en utilisant les mthodes 1 et 2 du b).

-III- Convergences en probabilit, en loi:


Les exercices de ce paragraphe tant plus difficiles, on les rservera aux mathmaticiens de comptition. Les esprits plus faibles pourront les regarder d'un air mprisant et passer au paragraphe suivant.

1) Soit la variable alatoire Xn valeurs dans {n, n+1, . . . , n} dfinie par sa distribution: 1 1 p X n = 0 = 1 et k X n () \ 0 , p X n = k = 2 . n 2n a) Reprsenter graphiquement cette distribution pour n = 5 ainsi que sa fonction de rpartition. b) Calculer E(Xn ) et Var(Xn) .

lq b

c) Etudier la convergence en probabilit de la suite (Xn). d) loi -.


page 33

SQ-20 Probabilits - Statistiques

2) Soit X une v. a. exponentielle de paramtre >0. a) Dterminer la fonction de rpartition G2, puis la densit g2 de Y2 = X . b) Gnraliser la variable alatoire dfinie par Yn = X . On note Gn et gn les f.r. et densit de Yn. c) tude des convergences en loi et en probabilit de Yn. Soit ]0, 1[. Calculer (n) = p Yn 1 > et lim ( n) . En dduire la convergence en probabilin

t Calculer lim G n ( y) pour y ]0, + [ . En dduire la convergence en loi.


n

(corrig page 71)

Remarque: en cas de convergence vers une variable certaine, on dmontre qu'on a quivalence entre convergence en probabilit et convergence en loi.

-IV- Thorme central limite:


1) Soit (Xk) une suite de variables indpendantes suivant une loi de Poisson de paramtre = 1. a) Vers quoi converge en loi la suite Yn = b) En dduire lim
X1 + K + X n n ? n

k =0

nke n 1 = . k! 2

2) On considre 50 v. a. continues de mme loi, indpendantes, d'esprance 45 et d'cart type 5. a) A quelle loi peut-on assimiler la somme S de ces variables ? S c) A l'aide de quelle loi peut-on approximer approcher la loi de la variable alatoire S = . 50 44 S 47 et S 47. Calculer les probabilits des vnements: S 44 3) On a mlang 5 000 roulements d'une marque A avec 10 000 de la marque B. On prlve au hasard 150 roulements. a) Quelle est la probabilit pour que la proportion de roulements A soit comprise entre 30 et 35% ? b) Quelle est la probabilit pour que le nombre de roulements A soit compris entre 45 et 60 ? 4) Au cours dune exprience, un vnement a une probabilit p de se produire. a) On note Xn le nombre de fois o cet vnement se produit sur n expriences indpendantes. Dterminer la loi de Xn et ses paramtres. Avec p = 0,15 pour quelles valeurs de nN* a-t-on p(X = 0) 0,01 ? c) Pour n = 500 , en prenant p = 0,6, calculer p 285 < X n < 315 . Quel rsultat obtiendrait-on avec lingalit de Bienaym-Tchebychev ? r r 5) (*) Une cible est centre sur lorigine dun repre O, i , j orthonorm. Une flchette est lance sur

cette cible, et on suppose que les coordonnes dimpact X et Y suivent des lois normales centres rduites indpendantes. Soit la variable alatoire Z = distance du point dimpact au centre. a) Montrer que, si H est la fonction de rpartition de Z, on a

R1 e si z 0 | H ( z) = S . |0 si z < 0 T

z2 2

b) En dduire la densit h de Z, puis calculer E(Z) et Var(Z). (Cf. exercice Chap.3 -VI- 5) page 29) c) On lance 150 flches sur la cible (les lancers sont indpendants), et on note M = distance moyenne des impacts au centre de la cible. Dterminer la loi qui approche celle de M.
page 34

UV SQ 20

d) Calculer les probabilits des vnements : (M < 0,7), (0 . 8 < M < 1). Pour quel intervalle I centr sur lesprance aura-t-on p(M I ) = 0,9 ? Pour des complments sur les jeux de flchettes, consulter le mdian de novembre 2003. De mme, si vous
navez pas trouv lesprance et la variance de Z, vous pouvez utiliser les rponses E( Z) = et Var ( Z) = 4
2 2

-V- Convergences usuelles:


1) Une usine fabrique des pices en grande srie en deux phases indpendantes. La premire phase est susceptible de donner un dfaut A avec une probabilit 0,02, et la deuxime un dfaut B avec une probabilit 0,08. a) Calculer les probabilits pour qu'une mme pice tire au hasard: prsente les deux dfauts ne prsente aucun des 2 dfauts prsente un seul des deux dfauts prsente au moins un des dfauts b) On prlve au hasard 200 pices dans la production et on note X le nombre de pices prsentant le dfaut A. Calculer: p(X = 0), p(X = 1), p(X = 10), p(X 3) Pour quelle valeur de k la probabilit p(X = k) est-elle maximale ? c) On prlve au hasard 300 pices et on note Y le nombre de pices prsentant le dfaut B. Calculer: p(Y < 24), p(20 < Y < 35), p(Y < 30Y > 24) 2) Fabrication de bouteilles: On fabrique deux types de bouteilles de masses 250 g et 1 kg destines recevoir des produits toxiques. La pte de verre en fusion servant mouler ces bouteilles contient des rsidus solides appels pierres dont la prsence dans une bouteille la rend inutilisable (plus fragile et d'tanchit approximative). On a remarqu que 100 kg de pte en fusion contiennent en moyenne 30 pierres. Dterminer le pourcentage de rebut de la fabrication pour chacun des types de bouteille. 3) Un fabricant de cordes de montagne soumet des cordes de nylon de 12 mm des essais du rupture (une charge de 80 kg est lche depuis une hauteur de 5 mtres). Le test consiste rpter cet essai jusqu rupture de la corde et on suppose (ce qui dans la ralit nest pas tout fait exact) que la corde ne subit aucune modification si elle ne rompt pas. La probabilit que la corde casse au cours dun essai est p = 0,09. Soit X la variable alatoire : nombre dessais avant rupture. a) Dterminer la loi de X, donner son esprance et sa variance. b) Aprs rupture de la corde on continue le test avec une deuxime corde identique la premire et on dfinit ainsi une seconde variable alatoire Y de mme loi. Si on pose Z = X + Y (Nombre dessais avant la seconde rupture). Dterminer la distribution de probabilit de Z, ainsi que son esprance et sa variance. c) On considre un lot de 50 cordes de 12 mm et on dfinit la variable alatoire N = nombre de cordes ayant rompu au cours du premier essai. Dterminer la loi de N et calculer p(N < 5).
NB: Des essais pratiqus sur d'anciennes cordes de chanvre ont montr qu'elles cassent toutes au premier essai !

4) On considre une variable alatoire X de densit f ( x) = a) Montrer que nN , on a I n = ( n + 1) =

b) En dduire la valeur de pour que f soit une densit de probabilit. c) Calculer lesprance et la variance de X (si toutefois elles existent).
page 35

R x e si x 0 . S0 si x < 0 T
3 x

x n e x dx = n! .

SQ-20 Probabilits - Statistiques

d) Calculer les probabilits de lvnement : p(X<2). e) On considre une suite de v.a. X1 , X 2 ,K , X 400 indpendantes et de mme loi que X, et les va-

riables alatoires S = X k et X =
k =1

400

S . Quelles sont approximativement les lois de S et de X ? 400

f) Calculer les probabilits des vnements 1560 < S < 1640 et 3,8 < X < 4,2 . 5) On sintresse au retard par rapport la dure de voyage prvue pour un voyage de 500 km par le t 2 e 0 ,5 t train. Ce retard R (exprim en minutes) suit une loi de densit h( t ) = 1R + ( t ) . 16 a) Montrer que h dfinit effectivement une densit de probabilit. En calculer lesprance et la variance. b) La direction des Chemins de Fer rembourse le billet si le retard dpasse 15 minutes. Calculer la probabilit dtre rembours. c) Calculer la densit de la variable alatoire R2 = dure totale de retard sur un aller retour. d) Un voyageur effectue le trajet (aller ou retour) 150 fois dans lanne. On note R150 la dure totale du retard, et N150 le nombre de fois pour lesquelles le voyageur a t rembours. c) Dterminer les lois approximatives de R150 et de N150 . Calculer p R150 > 950 et p N 150 5 . 6) Lnergie dune particule dun systme est une v. a. X de densit f ( x) =

g c

totale est la somme des nergies des particules, supposes indpendantes. a) Si il y a 1 600 particules dans le systme, dterminer la probabilit quil y ait entre 780 et 840 units dnergie dans le systme. b) Quel est le nombre maximum de particules que le systme doit contenir pour que lnergie totale soit infrieure 440 units avec une probabilit suprieure 0,975 ? c) Une particule schappe du systme si son nergie dpasse (ln 50)/2 units. Si le systme contient lorigine 200 particules, quelle est la probabilit quau moins 8 particules schappent ?

R2e S0 T

2 x

si x > 0

sinon

. Lnergie

-VI- Pour les linguistes


1) A certain town has a Saturday night picture audience of 600 who must choose between two comparable cinemas. Assume that the pictures-going public is composed of 300 couples, each of which independently flips a fair coin to decide which cinema to patronize. a) Using a central limit theorem approximation, determine how many seats each cinema must have so that the probability of exactly one cinema running out of seats is less than 0,1. b) Repeat, assuming that each of the 600 customers make an independent decision, instead of acting in pairs. 2) Consider the number of 3s which result from 600 tosses of a fair six-sided die. a) Determine the probability that there are exactly 100 3s, using a form of Stirling's approximation for n ! which is very accurate for these values, n ! e n n n 2 n . b) Use the Poisson approximation to the binomial Probability Mass Function (PMF) to obtain the probability that there are exactly 100 3s. c) Repeat part (b), using the central limit theorem intelligently. d) Use the Chebyshev inequality to find a lower bound on the probability that the number of 3s is:
page 36

UV SQ 20

between 97 and 103 inclusive, between 90 and 110 inclusive, and between 60 and 140 inclusive. e) Repeat part (d), using the central limit theorem and employing the DeMoivre-Laplace result when it appears relevant. Compare your answers with those obtained above, and comment.

page 37

SQ-20 Probabilits - Statistiques

Chap.5

Echantillonnage

-I- Statistiques sur un chantillon:


1) Position du problme Jusqu prsent, nous avons considr que les lois de probabilit utilises taient connues, ainsi que leurs paramtres. Dans la ralit, un phnomne alatoire tant tudi, on a gnralement une ide assez prcise de la loi de probabilit sous-jacente, mais on nen connat pas les paramtres.
Par exemple, dans un sondage prcdent des lections, lopinion dun lecteur (quon rduit lalternative Oui / Non) est rgie par une variable de Bernoulli B(1, p), o p est la probabilit de rpondre Oui la question. Le problme est la dtermination du paramtre inconnu p. Sil tait connu, il ne serait pas ncessaire de faire un sondage.

Pour la dtermination dun paramtre inconnu, on peut procder par tude exhaustive, cest--dire mesurer toute la population, ou par sondage en nen choisissant quune partie, un chantillon. Ltude exhaustive a lavantage de fournir une donne exacte dans le cas dune population finie, mais linconvnient dtre trop longue, de coter trop cher ou de dtruire la population.
Prenons lexemple de ltude de la rsistance la surtension dune ampoule lectrique. On soumet lampoule des tensions de plus en plus fortes jusqu ce que le filament fonde, et rende ainsi lampoule dfinitivement inutilisable. Une telle mthode sur la totalit de la production aurait pour effet de la dtruire compltement, ce qui du point de vue conomique serait tout fait dsastreux. On peut trouver nombre dexemples de ce type, quon appelle tests destructifs.

Dans le cas dun sondage, il faut, avant ltude, dterminer la taille de lchantillon permettant davoir la prcision souhaite. Le bon sens laisse penser que plus la taille est grande et meilleure sera la prcision de la mesure, ce qui est en gnral le cas. 2) chantillons Soit une variable alatoire X dfinie sur un espace probabilis (, A , p). Pour un entier n non nul, on appelle chantillon de taille n, ou n-chantillon, le n-uplet En = (X1, X2, ., Xn), o les Xk sont des variables (indpendantes ou non) de mme loi que X. Une mesure tant faite sur une population, on obtient une observation en = (x1, ., xn), qui est un lment de Rn. Il convient de ne pas confondre lchantillon, variable alatoire sur n, et son observation, vecteur de Rn.
Par exemple, lors dun sondage dopinion sur 1000 personnes, les rponses possibles sont 0 ou 1 (daccord, pas daccord) et la variable X est une variable de Bernoulli B(1, p), o p est la proportion de personnes tant daccord. On a alors lchantillon (X1, , X1000) o tous les Xk sont B(1,p) et lobservation (x1, , x1000) o les xk sont des 0 ou des 1. Dans ce cas, la population globale tant assez grande (celle dun pays gnralement) les variables Xk sont indpendantes. Un deuxime exemple : on veut tester la conformit dune petite production par rapport au cahier des charges. Si on sintresse une mesure, suppose normale N(M, ), on tudie un chantillon En, de variables normales. Si la taille de lchantillon nest pas petite par rapport la taille de la population, les variables ne seront pas indpendantes. Dans la pratique, la variance est connue, et on ne teste que lesprance M.

3) Statistique Une fois choisi lchantillon, il faut le traiter, par exemple pour dterminer une estimation dun paramtre ou pour effectuer des tests. Soit un chantillon En = (X1, X2, ., Xn) dfini sur (, A , p)n, on dfinit une statistique sur En comme tant une fonction : (X1, X2, ., Xn) Y = (X1, X2, ., Xn). On dfinit de mme
page 38

UV SQ 20

lobservation de la statistique y = (x1, x2, ., xn).

-II- Estimation ponctuelle:


1) Dfinition Soit une variable alatoire X dfinie sur un espace probabilis (, A , p), de paramtre , inconnu. On cherche dterminer une valeur approche de laide dun chantillon En et dune statistique Tn sur cet chantillon. Aprs le prlvement de lchantillon, on aura donc une observation en. valeur relle du paramtre, qui restera inconnue On a donc trois lments : Tn (X1 ,K , X n ) estimateur du paramtre $ = T(x ,K , x ) estimation ponctuelle de
1 n

Le problme est de construire un estimateur qui donne une bonne (notion restant dfinir) valeur de et, si possible, la meilleure possible. Il faut donc dfinir certaines proprits dun estimateur. 2) Exemples destimateurs Les paramtres inconnus les plus courants sont lesprance et la variance, si ces paramtres existent. On trouve aussi leurs drivs, paramtres dune loi de Poisson, dune loi gomtrique et dune loi exponentielle, qui sexpriment simplement partir de lesprance. Il est donc utile de trouver des estimateurs pour ces paramtres, et, si possible, des estimateurs simples calculer. Pour lesprance, on utilise la plupart du temps la moyenne T(X1 ,K , X n ) = X = pour la variance on peut utiliser la variance empirique T(X1 , K , X n ) = vrifier que ce sont des bons estimateurs. 1 n X k , alors que n k =1

2 1 n X k X . Il reste bien sr n k =1

-III- Proprits des estimateurs


1) Biais On dira que T est un estimateur sans biais de si E(T) existe et E(T) = . En dautres termes, lestimateur donne le bon rsultat. Dans la littrature statistique, friande dabrviations, on trouvera souvent e.s.b. pour estimateur sans biais.
Par exemple, on veut mesurer la longeur L dune barre dacier, exprime en centimtres. En effectuant plusieurs mesures, on obtiendra des longeurs proches de la longeur relle et la moyenne T(x1, ..., xn) de toutes ces mesures donnera une estimation convenable de L. Cest du moins ce que dicte le bon sens. Si toutes les mesures sont donnes en centimtres, on pourra penser que lestimateur T est sans biais. Par contre, si on se trompe doutil et quon effectue les mesures avec un instrument gradu en pouces, on aura aussi une estimation, mais elle sera fausse, et on aura un estimateur biais. Cet exemple est certes caricatural, mais il donne une ide de la notion de biais.

Sinon T est un estimateur biais, et T est le biais de lestimateur T. Il est possible que le biais dpende de la taille de lchantillon, et souvent quil diminue quand la taille n de lchantillon augmente, on aura alors un estimateur asymptotiquement sans biais si on a lim E(T) = 0 . Un
n

exemple sera trait un peu plus loin. 2) Convergence


page 39

SQ-20 Probabilits - Statistiques

Le problme a t voqu en dbut de chapitre, est-on en droit de penser que la prcision de lestimation crot avec la taille de lchantillon. Dans la ralit ce nest pas toujours le cas. On dira que lestimateur Tn est convergent si Tn proba quand n tend vers linfini, cest dire que > 0 lim p Tn > = 0 .
n

En utilisant lingalit de Bienaym-Tchebychev, on montre facilement que si la variance de Tn tend vers 0 quand n tend vers linfini, alors lestimateur Tn est convergent. Cela ne signifie pas quil soit sans biais, mais quil est asymptotiquement sans biais. Dans le cas dun estimateur convergent, la prcision augmente avec n, et, dans la pratique, on choisira n pour avoir la prcision souhaite par la situation. On naugmente donc pas la taille de lchantillon sans avoir des contreparties. A la lumire de ces paragraphes, on doit donc choisir des estimateurs sans biais et convergents, et si on a le choix entre plusieurs, on utilise celui qui a la variance la plus petite. 3) Estimateurs usuels a) Esprance Le langage courant en statistique mlange les notions de moyenne et desprance, ce qui est fcheux du point de vue de la rigueur mathmatique, mais qui ne pose pas de problme insurmontable dans la pratique. Cet amalgame vient de lestimateur de lesprance qui est presque toujours utilis, cest dire la moyenne arithmtique. Soit une variable alatoire X desprance M et la statistique moyenne arithmtique 1 n T X1 ,K , X n = X = X k . T est un estimateur sans biais de M et, si Var(X) existe et les Xk indpenn k =1 dantes, cest un estimateur convergent. En effet :

E(T) =

1 n 1 n E( X k ) = n M = M n k =1 k =1 1 n2

(linarit de l'esprance) , de plus, si Var(X) = 2 et les X k indpendantes 2 n avec lim Var (T) = 0
n

Var (T) =

Var ( X k ) =
k =1

1 n2

2 =
k =1

b) Variance Soit une variable X desprance M et de variance et un chantillon En de variables indpendantes Xk de mme loi que X. 1 n 2 Si M est connue, on a un estimateur de : 2 = X k M qui est un estimateur sans biais. En n k =1 ce qui concerne sa convergence, nous laisserons son tude de ct, il faudrait faire des hypothses sur les moments dordre 3 et 4, et ceci dpasserait le programme de cette U.V.

Dem.

E( 2 ) =

1 n 1 n 1 n E ( X k M ) 2 = E( X 2 ) 2 M E( X k ) + M 2 = E( X 2 ) M 2 = 2 k k n k =1 n k =1 n k =1

Dans le cas o M est inconnue, on lestime par X , qui nest plus une constante comme dans le cas prcdent. Si on considre lestimateur prcdent modifi, il nest plus sans biais, et il faut donc le rectifier. On a alors : 2 1 n E ( '2 ) = E X k X n k =1

FG H

h IJK

n 1 2 n Ce qui montre que cet estimateur est biais. On peut en construire un autre, cette fois ci sans biais, en =

page 40

UV SQ 20
2 1 n n '2 = Xk X . n 1 n 1 k =1 On utilisera donc quand lesprance est connue, et S quand lesprance est inconnue, estime par la moyenne.

considrant S2 =

4) tude dun exemple Soit une variable X uniforme continue sur lintervalle [0, b] o b est un paramtre positif inconnu et un chantillon En de variables Xk indpendantes de mme loi que X. b b2 On sait que E( X) = et que Var ( X) = 2 12
On peut considrer la situation suivante : le rservoir dune voiture utilise par plusieurs personnes dune entreprise, a une contenance inconnue de b (litres). Pour dterminer une estimation de b, on fait le plein chaque fois quon emprunte la voiture, sans connatre le contenu effectif (non vide) du rservoir dessence. On constitue ainsi un chantillon indpendant de variables uniformes de mme loi que X. On peut aussi traiter lexercice -VI- 1) page 45.

-IV- Vraisemblance dun chantillon


La situation de lestimation est, relativement, confortable quand on connat un estimateur pour un paramtre dune loi. Dans le cas contraire il serait intressant de connatre une mthode permettant de dterminer un estimateur, sans toutefois avoir la garantie que ce soit le meilleur possible. 1) Vraisemblance dun chantillon Avec les mmes notations que prcdemment, on considre un paramtre inconnu , un chantillon En et son observation en. a) Cas dune variable discrte La probabilit davoir effectivement lobservation en dpend gnralement de , et on peut supposer que, tant donn, cette probabilit sera trs faible pour des observations aberrantes, et au contraire plus levs pour des observations conformes la ralit.
Par exemple, on considre une pice quilibre (mais on ne le sait pas) et on la lance n fois en comptant la moyenne des Pile (=1) . Un chantillon donnant en moyenne 5% de Pile nest pas improbable, mme si sa probabilit est trs faible. Toujours est-il que lobservateur, nayant aucune information sur la pice, conclura, tort, quelle nest pas quilibre. Un deuxime chantillon donnant en moyenne environ un Pile sur deux lancers aura une probabilit plus leve.

Ceci nous amne la notion de vraisemblance dun chantillon. On dfinit, pour un paramtre et un chantillon en, la fonction de vraisemblance de en par : L: R n +1 0, 1 ( x1 , x 2 ,K , x n , ) a L(x1 , x 2 ,K , x n , ) = p ( X1 ,K , X n ) = ( x1 ,K , x n )

Cette vraisemblance est donc la probabilit de lchantillon observ. Elle dpend de , et la valeur la plus vraisemblable du paramtre serait celle qui maximise cette probabilit, en admettant que la fonction de ait un maximum. On va donc chercher la valeur de ce maximum pour en dduire un estimateur. La fonction L tant borne, elle a une borne suprieure dans tous les cas et un maximum absolu si L est continue par rapport . Pour dterminer , une hypothse supplmentaire sera ncessaire, savoir que L a des drives partielles dordre 2 par rapport .
On peut aussi tudier part le cas o L est nulle pour une valeur de . En ce point la probabilit ne sera pas maximale, et donc la valeur correspondante de ne sera pas lestimation cherche.

La fonction logarithme tant croissante, les maxima de L et ln (L) seront obtenus pour la mme vapage 41

SQ-20 Probabilits - Statistiques

qui permet de dfinir lestimateur de maximum de vraisemblance T(E n ) = X1 ,K , X n . Dans le cas o on cherche estimer plusieurs paramtres simultanment, par exemple esprance et variance, on est amen dterminer le maximum dune fonction de plusieurs variables. La mthode a dj t tudie dans des cours prcdents et il nest (peut-tre) pas ncessaire dy revenir. Exemple :
Soit X une variable alatoire qui suit une loi de Poisson de paramtre inconnu . On considre une observation dun chantillon indpendant en = (x1, , xn). On a donc :
L(x1 ,K , x n , ) = p ( X1 = x1 )K( X n = x n ) =
k =1 n e x k x k et donc = e n xk ! k =1 x k !

leur de , et il est gnralement plus simple dutiliser la fonction ln(L) plutt que L, surtout dans le cas o les variables de lchantillon sont indpendantes. L ln L =0 =0 ou quations de vraisemblance Alors sera solution des systmes 2 L 2 ln L 0 0 2 2 $ La solution de ces systmes, en admettant quelle soit unique, sera de la forme = ( x ,K , x ) , ce

R | | S | | T

R | | S | | T

ln L = n + x k l n ( ) x k !
k =1 k =1

bg

Les quations de vraisemblance scrivent donc :

On a donc lestimateur de maximum de vraisemblance de T(E n ) = X . Il reste dterminer le biais et la convergence de lestimateur trouv, ce qui dans ce cas est facile.

R ln L = 0 R n + x = 0 | | | S ln L | 1 = 1 x S n | | | 0 | x 0 T T
k 2 2 2 k

=x

b) Cas dune variable continue La situation est diffrente, car la probabilit de lobservation est nulle. On remplace donc les probabilits par les densits. Pour le reste la mthode est identique. Si lchantillon En a une densit g la fonction de vraisemblance scrit : L(x1, ..., xn, ) = g(x1, ..., xn) ou f(x1) ... f(xn) si f est la densit de X et les variables Xk sont indpendantes.

-V- Exercices
1) On considre une v. a. X de densit f ( x) = 2 x x 2 si x 0,+2 et f ( x) = 0 sinon . Question prliminaire : Reprsenter graphiquement la fonction f (en prenant = 1) Rappel de MT 12 : intgration des fonctions de la forme f ( x) = ax 2 + bx + c Mettre le polynme sous forme canonique et poser x = sin t , x = cht ou x = sht selon le rsultat. a) Dterminer pour que f soit effectivement une densit de probabilit. b) Montrer que E(X) = 1 et Var(X) = 0,25.
page 42

UV SQ 20

c) Soit X1 , X 2 ,K , X n , n tant un entier assez grand, une suite de v.a. indpendantes de mme loi que X, et on dfinit S n et X n par S n =

X
k =1

et X n =

1 Sn . n

Dterminer les lois de Sn et de X , leur esprance et leur variance. Comparer ce dernier rsultat p X1000 > 1,05 .

d) Pour cette question on prend n = 250. Calculer : p(245 S250 260) et p X250 > 1,05 .

e) Pour quelle valeur de n N aurait-on p 0,98 X n 1,02 = 0,95 ? 2) Soit X une variable normale desprance m=1,8 et de variance = 0,01. On dfinit les variables 40 S X k et X = avec X1 , X 2 ,K , X 40 tant une suite de variables alatoires alatoires Y = 40X, S = 40 k =1 indpendantes de mme loi que X.

a) Dterminer les esprances et les variances de Y, S et X . Il est possible de reprsenter les rsultats sous forme de tableau. b) Calculer p(1,7 < X < 1,9), et dterminer > 0 tel que p(1,8-< X < 1,8+)=0,95. c) Calculer p(68 < Y < 76), et dterminer > 0 tel que p(72-< X < 72+) = 0,95. d) Calculer les probabilits p(68 < S < 76) Dterminer >0 vrifiant p(72 < S < 72 + ) = 0,95 puis tel que p(1,8 < X < 1,8 + ) = 0,95 . e) Calculer les rapports 2 2 2 , 2 et 2 . Existe-t-il des relations entre , , et ? 2

3) Une machine automatique remplit des paquets. Les masses en grammes sur un chantillon de 10 paquets sont les suivantes: 297 300 295 297 300 310 300 295 310 300 . Dterminer la moyenne observe, l'cart type observ et en dduire une estimation de la moyenne et de l'cart type de la population. 4) Un contrle portant sur un emballage automatique de caf fournit les masses suivantes: masse en g 247 248 249 250 251 252 253 254 nombre de paquets 2 6 8 13 11 5 3 2 a) Donner une estimation de la masse moyenne dun paquet et celle de lcart type. b) En supposant la loi normale, dterminer, laide des estimations, les pourcentages de paquets de masse suprieure 250 g, de masse comprise entre 249 et 251. 5) Soit N une variable binomiale B(10, p) o p est un paramtre inconnu quon cherche estimer. On prlve un chantillon (N1, . . .,Nn) de variables B(10, p) indpendantes dobservation (n1, . . .,nn). a) Dterminer la fonction de vraisemblance L(n1, . . .,nn ,p) de cet chantillon. b) crire les quations de vraisemblance et en dduire lestimateur de max. de vraisemblance de p. c) On a obtenu, pour les nk, les rsultats suivants : 1 3 3 3 3 4 4 2 6 3 3 2 3 4 3 1 1 5 3 2 Dterminer une estimation ponctuelle de p. 6) Dans un tang se trouvent un nombre N poissons quon cherche estimer. Le mode opratoire est le suivant : on pche 100 poissons quon bague et quon remet dans ltang. On effectue une deuxime pche de 100 poissons et on compte le nombre X de poissons bagus. a) Soit k un entier naturel. Calculer en fonction de N la probabilit pN(X=k).

page 43

SQ-20 Probabilits - Statistiques

b) Dans le cas k = 10, calculer f ( N ) =

bx 100g c) Etudier et reprsenter graphiquement la fonction f dfinie sur R par f ( x) =


d) Pour quelle valeur de N la probabilit p(X=10) est-elle maximale ? e) En dduire une estimation de N.

p N ( X = 10) . p N 1 ( X = 10)

x 2 190x

7) Estimation du paramtre dune loi gomtrique : on considre un d cubique dont on ne sait pas sil est pip ou n quilibr, et on le lance jusqu' obtention dun six (succs, dont la probabilit est p). On note alors X la variable alatoire = nombre de lancers jusquau succs. a) Dterminer la loi de X, son esprance et sa variance. b) On rpte n fois lexprience prcdente pour obtenir un chantillon E n = X1 ,K , X n o Xk suit la mme loi que X. Une observation de cet chantillon est note e n de p lexpression L( x1 ,K , x n , p) = p( X1 = x1 )K p( X n = x n ) .
1 n

b g = b x ,K , x g . Calculer en fonction

c) En dduire les quations de vraisemblance de lchantillon en puis lestimateur de maximum de vraisemblance T de p. d) On a obtenu, pour n = 20 les rsultats suivants pour en : 3 2 4 6 1 2 3 5 4 2 2 1 6 2 1 6 9 4 4 2 Dterminer une estimation ponctuelle de p. Peut-on dire que ce d est pip ? 8) Etude dune loi exponentielle : Soit une v. a. exponentielle X de paramtre = 1 et un chantillon

bX ,K, X g de n variables indpendantes de mme loi que X.


1 n

a) Ecrire la densit, lesprance et la variance de X en fonction de (et non pas !). b) Dterminer la fonction L(x1 , .. . ,xn , ), puis les quations de vraisemblance. c) En dduire un estimateur de . Est-il sans biais, convergent ? d) Application numrique : Dix dispositifs indpendants dont la dure de vie (exprim en mois) est exponentielle ont fonctionn pendant les temps suivants : 20 4 12 2 16 26 48 9 34 6 Dterminer une estimation de , puis une estimation du paramtre . 9) On s'intresse la proportion p de personnes possdant un lecteur DVD. On tire au sort un chantillon ( X1 , X 2 ,K , X n ) de taille n dans une population trs grande. chaque personne interroge on asso1 si possde un lecteur DVD cie la variable alatoire Xk dfinie par: X k = . 0 sinon

R S T

a) Dterminer un estimateur T(X1 , X 2 ,K , X n ) de p. Etudier ses proprits (biais, convergence). b) On prend maintenant deux chantillons ( X1 , X 2 ,K , X n1 ) et ( X'1 , X'2 ,K , X' n 2 ) (indpendants) de tailles n1 et n2 (n1<n2) et on note f1 et f2 les proportions de possesseurs de lecteurs DVD pour les deux chantillons. Soit F = F1 + F2 > 0 et > 0 un estimateur de p. Dterminer et pour que F soit un estimateur sans biais de p. En dterminer la variance. c) Dterminer les coefficients et pour que F soit un estimateur sans biais et de variance minimale. (corrig page 71) d) Application numrique: n1 = 500 , n 2 = 1000 f1 = 0,3 et f2 = 0,23 . 10) Une variable a une esprance et une variance . Les variables X1,. . . , X5 tant indpendantes et de mme loi que X, on considre les estimateurs de suivants:
page 44

UV SQ 20

1 1 1 1 X1 +K+ X5 , T2 = X1 + X 2 + X 3 , T3 = X1 + X 2 , T4 = X1 +K+ X 4 + X5 et T5 = X5 5 3 8 2 a) Quels sont les estimateurs sans biais de ? b) Quel estimateur est le plus intressant ? T1 = 1 ( x 2m) e (loi normale rduite dcale), o le 11) Soit une variable alatoire X de densit f m ( x) = 2 paramtre m est inconnu. a) On considre un chantillon de n variables alatoires indpendantes de mme loi que X, dobservation x1 , x 2 ,K , x n . Dterminer la fonction de vraisemblance de cet chantillon.
2

b) Dterminer lestimateur de maximum de vraisemblance de m.

(Corrig page 72 )

-VI- Problmes:
1) Un vnement peut se produire tout instant X dans un intervalle I = [ 0 , b] , b inconnu. a) Dterminer la densit, lesprance et la variance de X (uniforme) en fonction de b. b) Pour estimer la valeur de b inconnue, on considre un n-chantillon X1 , X 2 ,K , X n et la variable

alatoire X =

1 n

X
i =1

. Calculer E( X) et construire un estimateur sans biais Y de b. En dterminer

lesprance et la variance.

a) Un second estimateur de b est dfini par Z = sup X1 , X 2 ,K , X n . Calculer, pour z[0, b], p(Z < z), et en dduire la fonction de rpartition et la densit de Z. En dterminer lesprance E(Z) et construire partir de Z un estimateur dans biais Z de b. d) Comparer les variances des estimateurs Y et Z, lequel est le meilleur ? e) Application : La procdure de dpart dun Grand Prix de Formule 1 est la suivante : Cinq feux rouges sont allums successivement, lextinction simultane de ces cinq feux donne le signal du dpart. Le temps qui scoule entre lallumage complet et lextinction est une variable uniforme sur [0, b]. (Ce temps est choisi par le directeur de course dans les limites du rglement) Au cours des 16 G.P. dune saison les intervalles de temps, en secondes ont t : 0,3 0,9 2,1 2,6 2,7 0,6 1,6 0,1 1,2 2,1 0,8 0,6 1,1 0,5 1,2 2,7 Dterminer une estimation de b.

R 1 xe si x > 0 | , o est un 2) Soit la variable alatoire X dont la densit est donne par: f ( x) = S |0 sinon T paramtre inconnu dont on cherche une estimation ponctuelle. On sait toutefois que est positif. Soit un chantillon ( E ) = b X , X ,K , X g d'observation (e ) = b x , x ,K , x g de variables indpendantes de
2 x n 1 2 n n 1 2 n

mme loi que X. a) crire la fonction de vraisemblance L(x1, , xn, ) de lchantillon (en). Ecrire les quations de vraisemblance de l'chantillon et en dduire l'estimateur de maximum de vraisemblance T. b) Calculer E(X) en fonction de . En dduire que lestimateur calcul au a) est sans biais. c) L'observation, pour n = 10 a donn les valeurs: 2,7 6,5 2 0,5 8,8 1,3 3,6 4,5 3 5,3. Dterminer une estimation ponctuelle du paramtre . d) On pourra utiliser librement le rsultat n N , ( n + 1) = x n e x dx = n!
0

page 45

SQ-20 Probabilits - Statistiques

Chap.6

Intervalles de confiance

-I- Introduction
Dans le chapitre prcdent, nous avons dfini les estimateurs et lestimation ponctuelle dun paramtre. Le problme est que, un paramtre tant estim, on ne dispose daucune prcision quant la mesure de ce paramtre. Il serait plus intressant davoir un rsultat de la forme : le paramtre se trouve avec la probabilit 1 dans lintervalle I = ]a , b[. Dans ce cas on se donne a priori un risque (de se tromper), la valeur de dpendant de la prcision souhaite. Sans anticiper sur les rsultats qui vont suivre, on peut penser que plus le risque est faible et plus la longueur de lintervalle I est grande. Dans les cas extrmes, si = 1 , I est rduit un point et si = 0 , I = R.

-II- Variable de confiance


1) Position du problme Soit : X une variable alatoire de paramtre inconnu quon cherche estimer Un chantillon En = (X1, , Xn) de n variables (souvent indpendantes), de mme loi que X T(X1, , Xn) un estimateur sans biais de (rappel E(T) = ). Une observation en = (x1, , xn) fournissant une estimation t de Problme : partir de t, dterminer un intervalle destimation du paramtre au niveau 1 , cest--dire un intervalle de confiance I ,T = T 1 , T + 2 tel que p T 1 < < T + 2 = 1 avec 1 et 2 rels

positifs pouvant tre gaux si la loi de T est centre sur . On obtient ensuite une observation de lintervalle de confiance I = ]t 1, t + 2[. On a donc un niveau de confiance 1 , de valeur par dfaut dans la pratique 0,95 et un risque (valeur usuelle 0,05). Pour des mesures plus sensibles ou dont les enjeux (humains ou financiers) sont trs importants, il est dusage de considrer = 0,01. Si dans la ralit on ne prend en compte que le dernier rsultat I = ]t 1, t + 2[, il faut garder lesprit que les valeurs t, 1 , 2 et nont rien dalatoire, et que, par contre, I,T est un intervalle dont les bornes sont des variables alatoires T 1 et T + 2. Plusieurs observations donneront des estimations ponctuelles, et donc des observations dintervalles de confiance diffrents, mais les mmes intervalles de confiance. Dailleurs, dans la pratique du calcul, on dtermine lintervalle I,T , puis on effectue lobservation. 2) Mise en place du calcul : Avec les mmes hypothses de dpart, on dtermine la loi de T, desprance , et dont on suppose que lesprance existe, puis on cherche, directement ou laide de tables de valeurs numriques, les valeurs 1 et 2 . En fait, il existe une infinit de tels intervalles ]T 1, T + 2[ , mais on choisit celui qui vrifie p(T 1 < ) = p(T 2 > ) = avant de calculer I = ]t 1, t + 2[. 2 Si la loi de T nest pas simple, en particulier dans le cas o on ne peut pas lapprocher par une loi normale, on construit une autre variable de confiance Y, dduite de T par des transformations, souvent affines, et dont on connat la loi. Des exemples seront donns pour les tudes les plus frquentes, esppage 46

UV SQ 20

rance, variances, paramtres dune loi de Poisson ou exponentielle. Remarque : I contient ncessairement lestimation ponctuelle t, mais pas toujours la valeur relle du paramtre . 3) Interprtation : Dans la pratique, on peut interprter p T 1 < < T + 2 = 1 par :

En moyenne, sur un grand nombre dchantillons (de mme taille n) prlevs, la valeur relle sera dans I dans 100(1 )% des cas et, cause des fluctuations alatoires, sera en dehors dans les cas restants. Pour sen convaincre, on peut faire une simulation sur ordinateur, avec une loi simple et laide de la fonction random implante dans tous les tableurs. On peut aussi interprter graphiquement les intervalles de confiance. Prenons deux cas courants, celui o la loi de T est symtrique par rapport , et le cas dissymtrique. Ralit :

observation

4) Proprits La longueur de lintervalle de confiance dpend directement de certains paramtres de la loi, ainsi que des choix qui sont faits pour la taille de lchantillon. En fait, les considrations pratiques (prcision souhaite, qualit des instruments de mesure, enjeux voqus plus haut, ) imposent une taille pour lintervalle de confiance, ceci ayant pour consquence dobliger lexprimentateur ou la matre douvrage de jouer sur les autres paramtres. Ayant choisi un estimateur sans biais, lintervalle est construit partir de , mais cela ne veut pas dire pour autant que sa longueur en dpend. Toutefois, et quand cest possible, on choisit un estimateur convergent, de telle sorte que la taille de lchantillon influe sur la prcision de la mesure, autrement dit sur la longueur de lintervalle. Dans ce cas, cette longueur diminue quand la taille augmente. Les autres paramtres tant constants, cest la longueur souhaite pour lintervalle qui influera sur la taille n de lchantillon et non pas linverse. En ce qui concerne , tout dpend du risque quon est prt prendre. Pour des mesures sur des vaccins, ou pour limplantation dune chane de production coteuse, le risque doit tre faible, alors que pour le simple rglage dune machine, on peut se laisser une marge derreur importante. Dans ce cas, le risque et la taille de lintervalle voluent en sens contraire. Prendre un chantillon trop grand augmente, sans utilit relle, le cot de ltude, et, au contraire, en prendre un trop petit ne donnera pas la prcision escompte. La variance de T est aussi prendre en compte. La prcision crot quand la variance diminue, la longueur de lintervalle et la variance variant dans le mme sens. Ayant le choix entre plusieurs estimateurs, on aura intrt choisir celui dont la variance est la plus faible, pour minimiser la taille de lchantillon.

-III- Intervalle dune variance


La plupart des variables utilises en statistique sont des variables normales, et quand elles ne le sont pas, la taille n et lindpendance des variables des lchantillons permettent souvent dutiliser le thopage 47

SQ-20 Probabilits - Statistiques

rme central limite. On tudiera donc pour la variance les cas o X est normale N(M, ), M tant connue (cas assez rares) ou inconnue. Il nest gnralement pas trs judicieux dutiliser des petits chantillons, sauf si les tests sont destructifs et trs coteux en temps ou en argent. 1) Cas X normale o M est connue : On suppose en outre que lchantillon est form de variables indpendantes. 1 n 2 Daprs le chapitre prcdent lestimateur sans biais de est 2 = X k M dont la loi ne fait n k =1

n n 2 X M est la = k 2 k =1 somme des carrs de n variables normales centres rduites indpendantes, et donc Y suit une loi n degrs de libert. Sa densit et sa fonction de rpartition ne sont pas particulirement simples, mais limportance de cette loi dans la pratique fait quelle est tabule, gnralement pour des valeurs de n allant jusqu 100.

pas partie des lois usuelles, mais par contre (transformation affine) Y =

FG H

IJ K

central limite montre que Y n suit approximativement une loi N(0; 1)


2n

Dans le cas o lchantillon est de taille suprieure 100, sachant que E(Y) = n et Var(Y) = 2n, le thorme

et den dduire 1 et 2. 2 Il est rare dans la pratique quon puisse dplorer davoir une variance trop petite, puisque ce serait le signe dune trs grande rgularit de production. Alors on cherche surtout avoir une majoration de la variance. On cherche alors un intervalle unilatral de la forme [0, [ avec p( > ) = . Il est donc facile de trouver y1 et y2 tels que p(Y < y1 ) = p(Y > y 2 ) = 2) Cas X normale o M est inconnue :
2 1 n Xk X mais n 1 k =1 alors les variables lintrieur des parenthses ne sont plus indpendantes puisque leur somme est ( n 1) S2 et suit une loi 2 . Le reste de nulle. On montre que la variable de confiance devient Y = n-1 2 ltude de lintervalle de confiance est identique.

La diffrence avec le cas prcdent est que lestimateur sans biais est S2 =

3) Exemple de calculs
Une entreprise utilise une matire isolante dans lassemblage de moteurs lectriques. Il est important que lpaisseur corresponde aux normes de montage, mais aussi que les variations ne soient pas trop importantes. Un chantillon alatoire, dont lpaisseur est normale N(M, Var(X)=), de 20 lments a t prlev dans une grande production et les rsultats en mm, ont t les suivants : 5,5 5,8 6,1 6,5 5,8 5,8 5,5 6,1 5,7 5,4 5,5 5,9 6,2 6,1 5,8 6,1 5,9 6,1 6,2 6 a) Dterminer des estimations ponctuelles de M et de . b) Calculer un intervalle de confiance de au niveau 0,95. Peut-on considrer que lcart type de la production ne dpasse pas 0,5 mm ? a) Daprs la calculatrice : estimation de la moyenne = 5,9, estimation de la variance : s = 0,0821 ( n 1)S2 19 S2 2 b) La moyenne tant estime, on a la variable de confiance de : Y = = 2 19 2 2 2 19 S 19 S Daprs la table du , on a : 0,95 = p 8,907 < Y < 32,852 = p < 2 < 32,852 8,907

On a donc lintervalle de confiance de 0,95 : I =

On peut donc considrer que la variance ne dpasse pas 0,25 et donc que ne dpasse pas 0,5.

OP 19 S , 19 S LM d'observation I = 0,0475; 0,175 Q 32,852 8,907 N


2 2

g FGH

IJ K

page 48

UV SQ 20

-IV- Intervalle dune moyenne


1 Xk , n dont on sait quil est sans biais et, quand les variables de lchantillon sont indpendantes, convergent. On se replace dans les conditions du dbut de chapitre : on a une variable alatoire X quon suppose gnralement normale N(M, ), desprance M quon cherche estimer par un intervalle de confiance au niveau 1 laide dun chantillon de taille nN. On construit la variable de confiance partir de X en la centrant et en la rduisant. Le problme est dabord de savoir si on connat ou si ce paramtre doit tre estim (par S). Pour lestimation de lesprance dune variable alatoire, on dispose de lestimateur X = 1) Cas o X est normale de variance connue : Si on suppose que les variables Xk de lchantillon sont indpendantes, on a alors le tableau ci-contre : XM On utilise alors la variable de confiance Y = n dont on sait quelle est normale centre rduite.
Variables Xk Loi normale - id - id - id Esprance M nM M 0 Variance n

X
X
Y

2
1

-V- Intervalle dune proportion

-VI- Exercices
1) Une machine fabrique des pices en grande srie. Des tudes antrieures ont permis de montrer que la masse, en g, de ces pices est une v.a. normale N (m = 1 200; = 40). a) On prlve un chantillon de n = 100 pices. 1 n X k des masses des chantillons ? Quelle est la loi suivie par la moyenne X = n k =1 Dterminer un intervalle de centre m dans lequel se trouvent 95% des moyennes d'chantillons. b) Quelle devrait tre la valeur minimale de n pour que la moyenne d'chantillon se trouve dans l'intervalle [1 196, +1 204] avec la probabilit 0,95 ?

2 2) On rappelle que si une v. a. U est normale centre rduite, alors U suit une loi 1 . Soit la variable 2 alatoire X qui suit une loi 1 , desprance 1 et de variance 2, ainsi que n variables alatoires Xi indpendantes de mme loi que X et leur somme Sn. a) Quelle est la loi de Sn, en dterminer lesprance et la variance. b) A quelle loi peut-on assimiler Sn dans le cas o n = 1000 ? Calculer alors les valeurs t1 et t2 telles que p(Sn < t2 ) = 0,975 et p(Sn < t1 ) = 0,025. c) Un tirage de 1001 pices dans une production en grande srie a donn une variance observe de 0,27. Dterminer une estimation ponctuelle de la variance de la population totale. d) Dterminer un intervalle de confiance 0,95 de .

page 49

SQ-20 Probabilits - Statistiques

3) Une usine produit des petites pices dont le diamtre est normal. On mesure le diamtre x de 100 pices prises au hasard dans la production et on obtient les rsultats suivants: x (en mm) 6 6,1 6,2 6,3 6,4 6,5 6,6 6,7 6,8 6,9 7 nb de pices 1 4 4 10 17 20 20 14 8 2 a) Calculer la moyenne et lcart type de cet chantillon. b) Estimer par un intervalle de confiance 95% le diamtre moyen de la production. 4) Le temps de faonnage dun livre dans une entreprise spcialise dans les ouvrages dart en petite srie est une variable normale desprance et de variance inconnues. Une observation sur 100 livres a donn un temps moyen de 5 heures avec une estimation de la variance s = 0,25. La production tant de 300 units, dterminer un intervalle de confiance de M au niveau 0,95. 5) Un constructeur automobile dsire connatre les gots de ses clients potentiels en matire de taille de vhicule. On note p la proportion de clients prfrant les petites voitures. Sur un chantillon de n personnes (n assez grand), on note Xn le nombre de personnes prfrant les petites voitures. 1 a) Dterminer les lois de X n et de X = X k . Quelle est la taille minimale de lchantillon pern k =1 mettant davoir sur p une prcision de 0,02 au niveau 0,95 ? (On pourra majorer p(1-p) par 0,25). b) Un chantillon de 500 personnes tant prlev dans une population trs grande, 192 ont prfr les petites voitures. Dterminer un intervalle de confiance de p 0,95.

6) Les deux cinmas d'une ville, le Lion et le Ballon ont une clientle globale de 600 personnes pour les sances du samedi soir. Ces 600 personnes ont le choix entre les deux salles (le film importe peu). a) On suppose que les personnes sortent en couples et dcident de la salle en lanant une pice (on ne sait pas si les pices sont quilibres). Si p est la probabilit de Pile (cinma le Lion) on note X le nombre de personnes qui se rendent au cinma Le Lion le 21 dcembre 2002. Etudier la loi de X. b) Les 300 lancers ont donn 137 Pile et 163 Face. Dterminer un intervalle de confiance de la probabilit de Pile au niveau de confiance 0,95. En dduire qu'on peut considrer que les pices sont quilibres c) Combien doit-il y avoir de places pour que la probabilit de refuser du monde dans une des deux salles soit infrieure 0,05 ? d) Reprendre la mme question (c) en supposant que les deux personnes de chaque couple lancent une pice, et, de ce fait, ne choisissent pas ncessairement la mme salle. 7) Los contratos de una empresa con sus clientes estipulan que, en los envos de piezas no debe haber ms de un 8% de piezas defectuosas. Un cliente recibe un lote de piezas y constata que, de 500 piezas probadas, 65 son defectuosas. Puede considerarse, con riesgo 0,01, que el envo resulta conforme al contrato ? Cul es el umbral mximo que hace que quede conforme el envo ? 8) On classe les pices dune grande production en deux catgories A : grande qualit et B : qualit courante , et on cherche valuer la proportion p de A dans la production. Un chantillon de 400 pices a donn 85 pices de catgorie A. a) Dterminer un intervalle de confiance de p au niveau de confiance 0,95. b) Quel est la valeur du risque devrait-on prendre pour que lintervalle de confiance ait une lon(corrig page 72) gueur de 0,04 ? 9) Pour la mise en uvre dun projet de dveloppement, un pays en voie de dveloppement doit connatre tout dabord la proportion p des personnes vivant en dessous du revenu minimum vital. Dans une tude pilote de 50 personnes, 30 sont considres comme pauvres , c'est--dire en dessous du minimum vital . a) Estimer la proportion de pauvres dans ce pays.
page 50

UV SQ 20

b) Calculer un intervalle de confiance 90% de la proportion de pauvres dans ce pays. c) Calculer un intervalle de confiance 95% de la proportion de pauvres et comparer avec le rsultat prcdent. d) Un nouvel chantillon de 200 personnes est prlev, et on observe une proportion de 0,6 de personnes en dessous du minimum vital. Calculer un intervalle de confiance 95% de la proportion de pauvres et expliquer la diffrence avec les rsultats prcdents. Calculer la taille dchantillon ncessaire pour avoir une prcision de 5% sur la proportion p avec un niveau de confiance de 90%.

-VII- Exercices dentranement


1) La mesure de la puissance de 5 machines laver, issues d'une mme chane de fabrication a donn les rsultats suivants (en watts): 3 550 3 560 3 580 3 600 3 620 a) Dterminer une estimation de la moyenne et de l'cart type de la population complte. b) Calculer un intervalle de confiance au risque 5% de la moyenne de la production.
Rep: m=3582 , s=28,64 Loi de Student M]3 546,+3 618[

2) Une tude sur les salaires mensuels de 50 ouvriers d'une usine a donn une moyenne de 6 000 avec un cart type de 500 (en FF). a) Quel risque prend-on en estimant la moyenne des salaires des 300 ouvriers de l'usine 6 000 100 ? b) Quel serait le risque dans le cas d'une trs grande usine ?
Rep: a) 12,4% b) 16,2%

3) Une collectivit a subi une intoxication alimentaire, et on suppose que la maladie s'est dclare de manire alatoire. Un examen, sur 100 personnes ayant mang ce jour l a rvl que 20 d'entre eux ont t affects de troubles. a) Dterminer une estimation de la probabilit d'tre malade au seuil de 3%. b) Quel peut tre le nombre de personnes malades parmi les 2 000 personnes nourries ce jour l (au risque de 3%) ?
Rep: a) p]0,115 ; 0,285[ b) entre 230 et 569 personnes

4) Sur 120 pices on a observ 20 pices dfectueuses. Dterminer un intervalle de confiance au seuil de 5% de la proportion de dchets.
Rep: 0,1 < p < 0,23

page 51

SQ-20 Probabilits - Statistiques

Chap.7

Tests d'hypothses

-I- Dfinitions

-II- Diffrents types de tests:

-III- Comparaison d'une moyenne une norme:

-IV- Etude des proportions:

-V-

-VI-

-VII- Exercices
1) Soit une preuve de Bernoulli B (1,p). On effectue deux tirages et on teste: 1 H 0 : p = 2 contre H 1: p = 2 . On accepte H1 si et seulement si on a deux succs. Calculer les va3 leurs des risques et . 2) Soit X une v.a. normale d'cart type 4 et de moyenne M inconnue. A l'aide d'un n-chantillon on veut tester Ho: M = 30 contre H1: M = 32 au seuil 0,05. a) Pour quelles valeurs de n le domaine d'acceptation de Ho contient 32 ? b) Etudier, pour n > no la relation entre n et le risque de seconde espce . Faire une tude analytique ou une tude graphique. 3) Soit X une variable N(M, = 1). On veut tester Ho: E(X) = 0 contre H1: E(X) = 1 au seuil 0,05. a) Dfinir un test. b) A partir de quelle valeur de n le test obtenu aura-t-il une puissance 1 0,9 ? 4) Soit la variable X, qui suit une loi de Poisson de paramtre = 0,4, un chantillon X1 ,K , X n de
page 52

UV SQ 20

1 n Xk . n k =1 k =1 a) Ecrire lesprance et la variance de X. Dans le cas gnral n entier quelconque (non nul) dterminer la loi de Sn ainsi que ses paramtres. b) Soit n = 25. Dterminer deux entiers n1 et n2 tels que p(n1 Sn n2) 0,95. Dans la cas o lobservation a donn une moyenne de 0,52, peut-on considrer que est effectivement gal 0,4 ? a) Soit n = 500. Par quelle loi peut-on approcher celle de X500 . S i on suppose que = 0,4, dterminer un intervalle x1 , x 2 tel que p x1 < X500 < x 2 = 0,95 . Une observation dun chantillon de 500 v.a. a donn une moyenne de 0,52. Ce rsultat est-il conforme aux hypothses ?

variables indpendantes de mme loi que X et les variables S n = X k et X n =

5) Une variable X est suppose normale, soit N(M = 20, = 16) ou N(M = 20, = 16) . On considre lhypothse nulle H0 : X N(M = 20, = 16) et la variable de test T = somme de trois rsultats. a) Quelle est la loi de T et calculer t tel que p(T < t ) = 0,95. En dduire le domaine D0 de H0. b) Calculer le risque = p(accepter H0 |H1 vraie) 6) Une machine automatique A permet de fabriquer des pices cylindriques, dont le diamtre X suit une loi normale d'esprance M = 5 et d'cart type = 0,005. a) Dterminer un intervalle ]M t , M + t[ qui contient le diamtre x d'une pice dans 95% des cas. b) On dispose d'un chantillon de 50 pices dont on ignore la provenance. La mesure des diamtres est consigne dans le tableau suivant: diamtre 4,965 4,975 4,985 4,995 5,005 5,015 5,025 5,035 nb de cylindres 1 0 13 18 17 0 1 Calculer le diamtre moyen et l'cart type de cet chantillon. Dterminer un intervalle de confiance 95% du diamtre moyen. c) Peut-on faire l'hypothse, au risque de 1%, que ces pices proviennent de la machine A ? 7) On considre une variable normale N(M, =9) et un chantillon indpendant de 30 lments. On veut tester les hypothses : Ho : M= 20 contre H1 : M = Mo au niveau 0,95. a) Dterminer la zone d'acceptation de Ho dans le cas o Mo > 20. b) Pour diffrentes valeurs de Mo (par ex. chelonnes de pas 0,5), dterminer la puissance du test. c) Tracer les courbes de puissance et d'efficacit sur un mme graphique. 8) Etude du risque : soit une variable alatoire X normale N(M, = 25) et un chantillon (X1, ,Xn) de variables indpendantes de mme loi que X, qui a donn une moyenne observe de 11. a) Dans le cas n =30, tudier le test H0 : M = 10 contre H1 : M > 10. En dterminer le domaine d'acceptation, ainsi que la dcision. b) Toujours dans le cas n = 30, tudier le test H0 : M = 10 contre H1 : M = 11. En dterminer la dcision et le risque . c) Le risque tant jug trop grand, on intervient sur la taille de l'chantillon pour le diminuer, les (Solution page 73) autres donnes tant inchanges. Pour quelle valeur de n aurait-on 0,1 ? 9) Un dentifrice doit contenir 15 mg une substance chimique que nous appellerons anthol. De nombreux chantillons de 100 doses choisies au hasard montrent une stabilit de fabrication. On constate que la concentration est normale d'esprance 15 et de variance connue = 0,016 (mg). On prlve un chantillon de 36 doses et on obtient les rsultats suivants (en mg): 14,96 14,92 14,80 15,05 14,86 15,01 14,81 14,86 14,99 14,96 15,01 14,91
page 53

SQ-20 Probabilits - Statistiques

15,01 15,03 15,05 14,85

15,04 15,01 14,98 15,15

14,85 14,95 15,11 14,90

14,97 15,16 15,01 15,20

14,84 14,98 15,16 15,00

14,74 14,96 15,04 15,06

Cet chantillon est-il conforme aux normes de production ? 10) Certaines modifications techniques apportes au carburateur dune motoneige permettraient dobtenir une amlioration de la consommation. Celle ci est une variable X gaussienne desprance M et de variance . Des essais ont donn les rsultats suivants en miles/gallon dessence. 20,6 20,5 20,8 20,8 20,7 20,6 21,0 20,6 20,5 20,4 20,3 20,7 a) Quelle serait linfluence sur la moyenne et la variance de la translation X= X - 20 ? b) Calculer des intervalles de confiance de M, puis de , au niveau 0,99. c) Si avant la modification technique la consommation tait de 20,2, peut-on conclure une amlioration trs significative ( au seuil 0,01). 11) Les lectures photomtriques suivantes reprsentent lintensit lumineuse du filament principal de deux marques de lampes miniatures utilises pour des feux clignotants dautomobiles : Fabricant A 28,64 29,28 29,20 28,92 29,51 Fabricant B 29,44 29,12 28,96 29,28 29,4 29,44 29,75 On sait par exprience que var(A) = 0,16 et var(B) = 0,2 pour B, et que les intensits sont N. Peut-on conclure au niveau de confiance 0,95, que les intensits sont les mmes ? 12) There are 240 students in a literature class (" Proust, Joyce, Kafka, and San Antonio"). Our model states that X, the numerical grade for any individual student, is an independent Gaussian random variable with a standard deviation equal to 10 2 . Assuming that our model is correct, we wish to perform a significance test on the hypothesis that E(x) is equal to 60. Determine the highest and lowest class averages which will result in the acceptance of this hypothesis: At the 0,02 level of significance At the 0,5 level of significance 13) Daprs une thorie sur le dveloppement de lintelligence dans un groupe donn de personnes, on sattend un QI (quotient intellectuel) moyen de 105. On sattend donc linvalidit de la thorie QI moyen = 100. On obtient donc le test statistique H0 : M = 100 contre H1 : M = 105. Lcart type du QI, suppos normal est = 15, le seuil de risque tant fix 0,1. a) Dterminer, pour une taille dchantillon de n = 25 le domaine de refus pour ce test le domaine dacceptation et le risque de deuxime espce . b) Quelles relations y a-t-il entre les risques de premire et deuxime espce ? c) Vous observez un QI moyen de 104. Quelle dcision prenez-vous ? 14) Une socit reoit rgulirement d'un fabricant des livraisons de botes de 100 composants. Un accord fixe le niveau de qualit 1 dfectueux par bote. Un contrle la livraison portant sur 1 000 composants donne 15 dfectueux. L'accord est-il respect au niveau de tolrance de 95% ? 15) A la suite d'un changement d'heure de diffusion d'une mission de tlvision, on effectue un sondage auprs de 400 personnes. parmi ces personnes, 152 ont regard l'mission. a) Dterminer un intervalle de confiance 95% de la proportion de personnes possdant un tlviseur qui ont effectivement regard l'mission. b) L'audience avec l'ancien horaire de diffusion tait en moyenne de 30%. Peut-on dire au seuil de 5% que le changement a augment l'audience ?

page 54

UV SQ 20

-VIII- Etude des petits chantillons:


1) Neuf malades auxquels fut administre une potion accusrent des augmentations de leur tension artrielle: 7 +3 1 +4 3 +5 +6 4 +1 . Montrer que ces donnes n'indiquent pas que la potion soit responsable de ces augmentations. 2) Pour juger de l'efficacit d'un nouveau semoir par rapport l'ancien, on a partag un terrain en 2 bandes qui ont t alternativement attribues au nouveau et l'ancien semoir. Pour 10 paires de ces bandes, les valeurs de l'excs de grain en faveur du nouveau semoir sont: 2,4 1,0 0,7 0,0 1,1 1,6 1,1 0,4 0,1 0,7 En supposant que ces augmentations suivent des lois normales indpendantes, dduire la supriorit du nouveau semoir par rapport l'ancien. 3) Un dosage de sucre dans une solution effectu sur 8 prlvements, provenant d'une mme fabrication, a donn les rsultats suivants, exprims en g/l: 19,5 19,7 19,8 20,2 20,2 20,3 20,4 20,8. a) Dterminer une estimation de la moyenne et de l'cart type de la fabrication. b) L'chantillon est-il reprsentatif de la production au seuil de 5%, si on admet que la concentration habituelle en sucre suit une loi normale de moyenne 19,6 g/l ?

-IX-

Problmes: Problme 1

Une machine automatique A permet de fabriquer des pices cylindriques. On admet que le diamtre de ces pices suit une loi normale d'esprance M = 5 (cm) et d'cart type = 0,005. a) Dterminer l'intervalle ]M , M + [ dans lequel le x d'une pice se trouve dans 95% des cas. b) On dispose d'un chantillon de 50 pices. La mesure des diamtres est consigne dans le tableau suivant, o les valeurs xi reprsentent les centres des classes [4,965;+4,975[; ... xi ni 4,97 1 4,98 0 4,99 13 5 18 5,01 17 5,02 0 5,03 1

Calculer une estimation de la moyenne et de l'cart type de la production totale. Dterminer un intervalle de confiance 95% du diamtre moyen d'une pice de la fabrication. b) Peut-on faire l'hypothse que les pices de cet chantillon proviennent de A ?

-X- Exercices avec solutions:


1) Un chantillon de 40 moteurs reprsentant une fabrication a donn un temps de fonctionnement moyen de 260 jours. Peut-on considrer cet chantillon comme appartenant la fabrication habituelle dont la loi de fonctionnement, en jours, est normale d'esprance 240 et d'cart type 50 ? corrig page 73 Faire l'tude pour des seuils de 5% et 1%. 2) Soit X une variable alatoire normale de moyenne m et de variance 25. Sur la base d'un chantillon de taille 9, on veut tester l'hypothse Ho: m = 0 contre H1: m = 3. a) Construire une rgion critique au seuil 0,05. Rep: valeur maximale 2,742 b) = 0,438 b) Calculer la probabilit d'erreur . 3) a) En jetant une pice de monnaie 3 fois, on veut tester l'hypothse Ho: p(pile) = 0,5 contre l'hypothse contraire H1: p(pile) = 0,75. On convient de rejeter Ho si on obtient trois fois pile. Calculer les probabilits d'erreur de premire et de deuxime espce. b) Dterminer une rgion critique si on jette la pice 25 fois et si = 0,05. Calculer ensuite .
page 55

SQ-20 Probabilits - Statistiques Rp: a) =1/8 = 37/64 b) R = {X17} = 0,15

4) Lorsquune machine est bien rgle elle produit des pices dont le diamtre moyen est 25 mm. Deux heures aprs un rglage de la machine on a prlev au hasard un chantillon de 9 pices. Les diamtres ont pour mesures, en mm : 22 23 21 25 24 23 22 26 - 21. Que peut-on conclure, au niveau de confiance 95%, quant la qualit du rglage de la machine aprs deux heures de fonctionnement ?
Rep: v.a. normale, moy = 23, s=1,73, n<30 Test de Student T(8) D0=]23,7 ; 26,3( donc drgle

page 56

UV SQ 20

Chap.8

Tests paramtriques

-I- Comparaison de deux moyennes:


1) Deux filiales fabriquent des piles lectriques de 4,5 V, dont les dures de vie sont normales et de variance 64 pour A et 25 pour B. Deux chantillons ont donn les rsultats suivants: filiale A: taille 100 dure de vie moyenne: 84 heures filiale B:taille 150 dure de vie moyenne: 80 heures a) La diffrence des moyennes des dures de vie est-elle significative au seuil de 5% ? b) Quelle serait la diffrence maximale, au seuil de 1%, permettant de conclure une absence de diffrence entre les deux productions ? 2) Une entreprise fabrique des sacs en plastique pour dchets. Le poids maximum que peuvent supporter ces sacs est une variable normale desprance 58 kg et dcart type 3 kg. a) L'entreprise propose le remplacement des sacs dfectueux (qui cderaient un poids infrieur un poids annonc). Quelle est la valeur de ce poids si elle ne veut pas remplacer plus de 6% des sacs ? b) Un client achte 100 sacs. Quelle est la probabilit pour qu'il y ait plus de 5 sacs dfectueux ? c) Deux tests sont faits des dates diffrentes. premier test: 100 sacs moyenne 58 cart type s1 = 3 second test: 150 sacs moyenne 55 cart type s2 = 5 En supposant lgalit des variances, dterminer une estimation de la variance commune. Peut-on considrer, au risque de 5% que la qualit des sacs a volu entre les deux tests ? 3) Dsirant juger le travail d'un ouvrier ajusteur, un chef d'atelier prlve un chantillon de 50 pices mtalliques dans sa production. On associe le caractre X l'paisseur de ses pices. On doit avoir E(X) = 5 (mm). Les rsultats de la vrification sont ports dans le tableau suivant: mesure 4,8 4,9 5,0 5,1 nb de pices 5 15 20 10 Cette fabrication est-elle conforme aux exigences, au seuil de 1%? 4) Un chantillon de 100 projecteurs de studio de qualit A a donn une dure de vie moyenne de 1 400 heures avec un cart type de 120. Un chantillon de 200 projecteurs de qualit B a donn une dure de vie moyenne de 1 300 heures avec un cart type de 80. a) Dterminer des intervalles de confiance 0,95 des dures de vie des deux types A et B. b) Peut-on dire, au seuil 0,05, puis au seuil 0,01, qu'il existe une diffrence de longvit entre les deux types de projecteurs ? 5) Deux techniciens sont affects des tests de duret sur des feuilles de mtal avant expdition. Le problme est de dterminer sil existe des diffrences entre les mesures des deux techniciens. On supposera que la feuille de mtal utilise pour le test est homogne et que la variable est normale desprance M et de variance . Les mesures sont consignes dans le tableau suivant : Technicien A 529 528 526 527 525 525 526 527 528 525 Technicien B 527 522 523 526 523 525 526 524 527 523 a) Calculer, pour chacune des deux sries, la moyenne et une estimation de la variance.
page 57

SQ-20 Probabilits - Statistiques

b) En admettant lgalit des variances, dterminer une estimation de la variance relle. c) Peut-on dire quil existe une diffrence entre les deux techniciens ? d) En ne gardant que la premire srie (technicien A avec les valeurs obtenues au a)) on veut tester M = 526 contre M = 526,9 au seuil de risque 0,05. Quel est le rsultat du test et sa puissance ? 6) Un grupo de planificacin urbana pretende estudiar las diferencias en el ingreso medio de los habitantes de dos zonas en una ciudad. Para ello se dispone de dos muestras aleatorias simples de ingresos por habitante para cada una de las zonas. Zona 1 : Tamao muestral : 8 media muestral : 15 700 ptas desviacin estandar muestral 700 Zona 2 : - - - 11 - - - - : 14 500 ptas - - - - - - - - 850 Suponiendo que el ingreso por habitante es une variable aleatoria normal: a) Utilizando un nivel de significacin del 5 %, determine si existe evidencia de que la variancia del ingreso sea distinta en las zonas. b) Obtenga un interval de confianza al 95 % para la differencia del ingreso medio en las zonas. 7) Pour une variable normale N(M, ), on effectue le test H0 : [ M = 0, = 2] H1 : [ M = 1, = 4] avec un chantillon de taille n = 36. a) Pour et , risques de premire et deuxime espce, reprsenter graphiquement la relation entre et , en prenant des valeurs varies de . b) Refaire le graphique dans le cas o n = 100. 8) Deux serpents C et R prennent un verre dans un snake bar. -C- Sais-tu que dans ce bar les verres sont plus remplis que dans le bar den face. -R- Tiens donc ! -C- Un chantillon de 30 verres a une moyenne de 35 cl (et un cart type de 5) ici, alors quen face la moyenne sur 45 verres est de 30 avec le mme cart type. -R- Daccord, mais je ne suis pas porte sur les statistiques. Quest-ce que a veut dire ?

-II- Tests sur les proportions:


1) Au cours de deux livraisons diffrentes on a relev 48 articles dfectueux parmi les 800 constituant la premire livraison, puis 32 articles dfectueux parmi les 400 constituant la seconde. Les deux pourcentages d'articles dfectueux diffrent-ils significativement (seuil 5%) ? 2) Un sondage effectu auprs demploys de deux centres de production dune mme entreprise de construction automobile porte sur la prfrence entre une participation au capital de lentreprise ou une augmentation de salaire. Sur un chantillon alatoire de 150 employs du centre C1, 75 favorisent laugmentation du salaire alors que le rsultat pour C2 est de 107 sur 200 employs interrogs. a) Dterminer une estimation de la proportion p demploys favorables laugmentation pour lensemble de lentreprise. b) Dterminer un intervalle de confiance de p au niveau 0,95. c) Existe-t-il, au niveau 0,99, une diffrence entre les rponses des deux centres. d) Le mme sondage, effectu sur un chantillon de 350 employs parmi les 800 dune entreprise de sous-traitance a donn 165 employs favorisant laugmentation de salaire. Peut-on affirmer, au seuil de
page 58

UV SQ 20

5%, que les opinions sont quitablement partages au sein de cette entreprise entre les deux propositions ? 3) Un quotidien publie tous les mois la cote dun certain nombre dhommes politiques. Au 1er mois de mars la cote du Premier Ministre tait de 42% dopinions favorables. Au premier avril elle est de 39% et le journal de titrer le Premier Ministre en baisse dans les sondages ! . Commentaire dun statisticien averti ? 4) On veut tester lefficacit dun insecticide B par rapport un autre A dj prsent sur le march. On vaporise A sur 250 insectes et 180 rendent lme. Dautre part 300 insectes (pas les mmes que les premiers) ont eu la chance dtre traits avec B et 80 ont survcu. a) Quelles sont les variables alatoires qui interviennent dans cette exprience et quelles sont les hypothses formuler avant de se livrer un test sur les deux produits ? b) Si p est la proportion de survivants aprs avoir reu A, dterminer un intervalle de confiance de p. c) Tester au mme seuil de 0,05 si la proportion dinsectes limins par B est suprieure celle de A.

-III- Test sur une variance:


1) Le relev des prix X d'un mme article dans 15 magasins a donn les rsultats suivants: 42,7 42,6 43,0 43,5 42,8 43,1 43,6 42,9 41,6 42,8 42,9 43,2 42,6 43,1 43,1 a) Dterminer des estimations de la moyenne, de la variance et de l'cart type de la population. b) Le moyennes et variances habituelles sont de 43 et 0,1. Peut-on dire au seuil de 0,05 que ces prix ne sont pas conformes aux prix habituels ? c) La tolrance d'une association de consommateurs admet une variabilit, mesure par le rapport de l'cart type au prix moyen, qui ne doit pas dpasser 0,7%. Doit-elle ragir ? 2) L'cart type de la dimension d'une pice actuellement utilise dans le montage d'un ensemble mtallique est assez petit (o=0,02) pour ne pas poser de problmes d'assemblage. Il a t propos au service commercial des pices analogues (de mme moyenne connue) un prix moins lev. On envisage de changer de fournisseur, sous rserve que l'cart type des nouvelles pices soit le mme que dans la situation antrieure. Sur un chantillon de 100 pices on mesure un l'cart type gal 0,0245.Quelle conclusion adopter au seuil 0,05 ?

-IV- Comparaison de deux variances:


1) Une tude statistique sur deux populations normales a donn les rsultats suivants: estimation de la variance de 120 1re population: chantillon de 25 me 2 population: chantillon de 10 - - - - - - - - - - 40. Peut-on admettre au niveau de 95% que les deux chantillons proviennent de deux populations ayant la mme variance ? 2) Une usine produit des lots dont un caractre X est normal N (m,=4). La fabrication ayant d tre interrompue pour travaux, le producteur veut s'assurer, lors de la reprise, que cet cart type reste gal 4. Pour ce faire il prlve un chantillon de 15 lots et relve un cart type observ gal 4,5. Peut-on considrer, au seuil de 5% que l'cart type se soit modifi ? 3) Le matre duvre d'une construction a mandat un laboratoire pour valuer la qualit d'un mlange bitumeux provenant de deux usines. On effectue une vrification sur 115 m3 de bton et on mesure la rsistance la compression, aprs 3 jours, sur des cylindres. Les rsultats de cette rsistance sont consipage 59

SQ-20 Probabilits - Statistiques

gns dans le tableau: usine 1 usine 2 Nombre de cylindres 25 25 Rsistance moyenne 90,6 94,4 65,42 58,24 Variance (S2) a) Peut-on, au niveau de confiance de 95%, faire l'hypothse que la variabilit de la rsistance la compression du bton provenant des deux usines est identique. b) Peut-on affirmer, 1%, que l'usine 1 a des performances meilleures que celles de l'usine 2 ? 4) Deux chantillons sont prlevs au hasard et de manire indpendante dans deux populations normales. Les rsultats sont les suivants: chantillon 1 80 80 78 80 80 78 80 79 80 81 80 81 77 75 80 80 81 79 78 82 chantillon 2 77 78 84 82 80 84 82 78 81 81 79 81 80 82 84 84 a) Tester l'galit des deux variances au risque de 0,05. b) En dduire une estimation de la variance commune. c) Tester enfin l'galit des deux moyennes.

-V- Etude des petits chantillons:


1) Un chantillon de 16 lments d'une v.a. normale a donn: x = 415 et ,

, (x 415)
i i =1

16

= 135.

Montrer que l'hypothse d'une moyenne de 43,5 pour cette population n'est pas raisonnable et que l'intervalle de confiance au niveau 95% pour la moyenne est [39,9; 43,1]. Un 20-chantillon tir d'une population inconnue est tel que:y = 43 et

(y 43)
i i =1

20

= 171 .

Montrer que les deux chantillons peuvent tre considrs comme tirs d'une mme population. 2) Pour un chantillon de 10 animaux nourris suivant le rgime A les augmentations de poids ont t, pour une certaine priode de: 10 6 16 17 13 12 8 14 15 9 (en kg). Pour un autre chantillon de 12 animaux nourris suivant le rgime B les augmentations de poids ont t, pour la mme priode de: 7 13 22 15 12 14 18 8 21 23 10 17 Montrer que les moyennes ont augment de 12 kg pour A et de 15 kg pour B, ce qui n'est pas significativement diffrent. 3) On a tudi la consommation d'essence, en litres et sur 100 km, de voitures de mme marque et de mme cylindre, choisies au hasard la sortie de deux chanes de fabrication situes dans deux centres de production A et B. Ces voitures sont conduites par me mme conducteur sur le mme circuit. Les rsultats sont: Consommation 8 9 10 11 12 Consommation 8 9 10 11 12 nb de voitures de A 1 3 4 5 3 nb de voitures de 0 4 6 4 2 B On suppose que la consommation, pour les deux chanes de fabrication, suit une loi normale de mme cart type . a) Calculer les moyennes de consommation pour ces deux centres. b) Dterminer une estimation de partir des donnes ci-dessus. c) L'cart de moyenne est-il d des fluctuations d'chantillonnage au risque de 1% ?

page 60

UV SQ 20

-VI- Problmes:
Problme 1 (dure approximative 35 min)
On a mesur, sur un chantillon alatoire de 20 observations d'un caractre X dans une population P1 suppose normale, une moyenne gale 36 pour une variance de 40. a) Dterminer une estimation de la variance pour l'ensemble de la population P1. b) Tester, au risque 0,01, l'hypothse selon laquelle la moyenne M1 de P1 est suprieure 30. c) Quelle valeur doit avoir cette moyenne si on veut que la puissance du test soit 0,95 ? d) On effectue 25 mesures du mme caractre X sur une seconde population normale P2. On trouve alors une variance gale 60. Peut-on dire, au seuil de 0,98, que les deux populations ont une mme variance ? e) Donner, au seuil de 0,98, un encadrement du rapport de ces variances. f) Au mme risque, dans quel intervalle doit se situer la moyenne X 2 sur les 25 mesures faites dans P2 pour qu'on puisse considrer les moyennes comme gales dans les deux populations ?

Problme 2
1) a) Une marque de piles assure un usage moyen de plus de 50 heures pour sa production. Sur un chantillon de 100 piles on mesure un temps moyen de 52 heures avec un cart type de 4 heures. Cet chantillon est-il conforme aux normes de fabrication au seuil de 1% ? b) Deux usines comparent leurs productions. Les piles sont considres comme mauvaises si elles durent moins de 48 heures. la premire fournit un chantillon de 200 piles dont 10 mauvaises la seconde .................................. 500 ............ 40 ............... Existe-t-il, au seuil de 5% une diffrence significative entre les deux productions ? c) Donner un intervalle de confiance au niveau 95% du pourcentage de mauvaises piles dans l'ensemble des deux productions. 2) Un fabricant de composants lectriques fabrique des rsistances dont la valeur nominale est 1 000 . Pour vrifier le procd de fabrication on prlve un chantillon alatoire de 64 rsistances et les calculs de la moyenne et de lcart type donnent les rsultats suivants: x = 990 et s = 100 ( en ) . a) Elaborer une rgle de dcision 0,05 pour tester si le procd est centr 1 000 . Doit-on supposer la distribution des rsistances comme tant normale ? b) Avec les mesures effectues, doit-on accepter lhypothse nulle ? c) Quelle est la probabilit d accepter lhypothse nulle si le procd est en ralit centr 1 050 ? Identifier ce risque. d) Quelle est la puissance du test = 980 ?

page 61

SQ-20 Probabilits - Statistiques

Chap.9

Tests d'ajustement

-I- Ajustement graphique


1) On considre la srie statistique: intervalles 20 21 22 23 24 25 26 27 28 29 effectifs 2 4 13 40 65 52 18 6 6 a) Dterminer les frquences, les frquences cumules croissantes et montrer graphiquement l'aide du papier Gausso-arithmtique qu'on peut considrer cette srie comme tant normale. b) Dterminer graphiquement la moyenne et l'cart type. c) Vrifier ces estimations par le calcul. 2) Construire l'aide d'un papier gausso-arithmtique une srie statistique de 10 intervalles dont la loi sous-jacente est une loi normale X de paramtres m = 5 et (X) = 0,05. 3) Un constructeur automobile dsire vrifier que la consommation de son nouveau modle correspond aux prvisions des ingnieurs ayant mis au point la voiture, c'est--dire d'environ 7 litres aux 100 km. Les techniciens effectuent les essais suivants: Pour les 1 000 premires voitures sorties de l'usine, on mesure le nombre de kilomtres parcourus avec 7 litres d'essence, et on obtient les rsultats suivants (on arrondit au kilomtre entier le plus proche): nb de km 92 93 94 95 96 97 98 99 100 101 102 103 104 nb de voitures 0 7 18 47 95 201 271 192 98 49 15 6 1 a) Vrifier graphiquement que la consommation en nombre de km, suit une loi normale. b) Dterminer graphiquement les valeurs de m et de . f) En dduire la consommation moyenne, en litres aux 100 kilomtres. La fabrication est-elle conforme aux prvisions ? 4) On effectue une enqute (anonyme) sur le temps de travail personnel hebdomadaire dun tudiant pour une UV. Les rsultats (en heures) sont les suivants.

0, 1 1, 2 2, 3 3, 4 4, 5 5 5 5 5 Nb dtudiants 14 20 14 13 12 5 6 5 4 tudier, laide du papier de Gauss, si on peut considrer cette srie comme tant normale.

Temps en heures

-II- Test 2 d'ajustement:


1) On considre un prisme constitu d'une matire homogne et dont les bases sont deux triangles quilatraux. On note A1, A2 et A3, les 3 faces latrales et B1 et B1 les bases triangulaires. On lance le prisme 500 fois et on constate que le prisme est tomb: 111 fois sur A1, 113 fois sur A2, 118 fois sur A3, 81 fois sur B1 et 77 fois sur B2. Tester au seuils de 0,05 et 0,01 l'hypothse selon laquelle les 5 faces sont quiprobables. 2) Dans un centre de calcul, le nombre de pannes enregistres par semaine est considr comme une

page 62

UV SQ 20

variable alatoire X. Pour une priode portant sur 100 semaines, on a observ les rsultats suivants: pannes / semaine 0 1 2 3 4 5 6 nombre de semaines 59 26 8 3 2 1 1 Vrifier au niveau 0,01, l'hypothse Ho : X obit une loi de Poisson. 3) Tester analytiquement la normalit de la srie de l'exercice -I- 1) page 62 .

4) Quatre vols commerciaux dcollent chaque jour dun petit aroport rgional. Le directeur de laroport compte le nombre de vols qui partent lheure chaque jour dune priode de 200 jours. Les rsultats sont consigns dans le tableau suivant : Nombre de dparts lheure 0 1 2 3 4 Nombre de jours observs 13 36 72 56 23 Au seuil 5 % , tester lhypothse que la distribution est binomiale. 5) Une srie de mesures portant sur les masses de paquets transports dans un monte-charge a fourni le tableau ci-dessous: Masse en kg 50...60 60...70 70...80 80...90 90...100 nb de paquets 61 260 380 232 67 a) Calculer la moyenne et l'cart type de cette srie. b) On fait l'hypothse selon laquelle la variable X donnant la masse d'un paquet est normale de moyenne m = 75 et d'cart type = 10. Dterminer les effectifs thoriques pour les diffrentes classes auxquelles on ajoutera les classes ]- , 60[ et [90 , + [. c) Effectuer un test du 2 au seuil de 5%. Peut-on accepter l'ajustement par cette loi normale? 6) Supposons que votre professeur de mathmatiques vous donne, comme travail la maison, le problme du test dquilibre dun d 6 faces. On vous demande de lancer 6 000 fois et de noter combien de fois les rsultats 1, 2, et 6 sortent. Lancer le d devient rapidement ennuyeux, alors vous dcidez dinventer des donnes ralistes. En faisant attention pour avoir un total de 6 000. vous crivez: Numro observations ? b) Le professeur nest pas n de la dernire pluie. Que dit-il en voyant les rsultats ? 7) On veut tester l'hypothse H selon laquelle la v.a. X obit une loi normale N (1,1, = 0,2). Pour une srie de 1 000 preuves indpendantes on a obtenu les rsultats suivants: rsultat 0,6 0,7 0,8 0,9 1 1,1 1,2 1,3 1,4 Nb de succs 26 51 107 168 200 193 138 80 29 8 a) L'hypothse H peut-elle tre accepte au niveau 0,95 ? b) A partir de quel seuil peut-on accepter H ? c) Tester maintenant lhypothse selon laquelle X suit une distribution normale, 95%. 8) Les gaz d'chappement d'un moteur contiennent des particules solides. On suppose (hypothse Ho) que le nombre de ces particules contenues dans un trs petit volume suit une loi de Poisson P (m). Pour tester Ho on prlve 400 chantillons de mme volume, et, grce une analyse ultra-microscopique on numre 1872 particules dont la rpartition est donne par le tableau: nb de particules 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 nb de prlvements 0 20 43 53 86 70 54 37 18 10 5 2 2 0 0 a) Calculer la moyenne et la variance de cette srie. d) Peut-on accepter l'hypothse Ho au seuil de 0,05 ?
page 63

1 988

2 3 4 5 6 991 1010 990 1013 1008

a) Effectuez le test: H0 : le d est quilibr contre H1 : le d non quilibr avec = 0.01, = 0.1

SQ-20 Probabilits - Statistiques

9) On veut tester l'hypothse H0 selon laquelle la v. a. X obit une loi exponentielle E (). Pour une srie de 100 preuves indpendantes on a obtenu les rsultats suivants: rsultat 10 20 30 40 50 60 70 80 Nb de succs 21 22 15 9 9 6 5 3 10 a) Calculer la moyenne de cette srie et en dduire une estimation de . b) L'hypothse H0 peut-elle tre accepte au niveau 0,95 ? 10) Dans une entreprise industrielle labsentisme semble tre un problme auquel plusieurs contrematres doivent faire face. Le Directeur des Ressources Humaines a effectu un relev du nombre de personnes qui ne se sont pas prsentes au travail sur une priode de 200 jours, qui a donn le tableau suivant: Nombre de personnes absentes 0 1 2 3 4 5 6 7 Nombre de jours 15 30 48 46 34 21 4 2 a) Dans une lettre la direction, il affirme que le nombre de personnes absentes en une journe se comporte selon une loi de Poisson avec un taux moyen de 3 personnes par jour. Cette affirmation paratelle vraisemblable au niveau 95% ? b) A la suite de cette tude, il a t dcid de prolonger la statistique en observant les absences dans les bureaux de lentreprise, dans les secteurs du secrtariat (S) et de la comptabilit (C) sur des chantillons de 350 personnes (S) et 250 personnes (C). Il a t relev au cours dun mardi, dans une semaine ne comportant pas de jour fri, 20 personnes absentes dans (S) et 10 dans (C). Existe-t-il une diffrence significative dans les taux dabsentismes des deux secteurs ? 11) Un laboratoire reoit, par groupes de 4 des souris grises et blanches destines aux exprimentations. Une hypothse gntique simple conduit supposer que les couleurs sont galement rparties entre les souris. Soit X le nombre de souris blanches d'un lot de 4. a) Dterminer la distribution de probabilit de X. b) Le laboratoire a reu 200 lots de 4 souris et a observ les rsultats suivants: X 0 1 2 3 4 nb de lots 13 65 72 35 15 Les rsultats sont-ils compatibles au seuil de 5% avec l'hypothse gntique suppose ? d) Les souris viennent d'un mme levage. Estimer la frquence p des souris blanches de l'espce partir des 800 souris observes. Calculer un intervalle de confiance de p au niveau 95%.

-III- Tests d'indpendance:


1) On veut examiner si l'habilet manuelle d'une personne est indpendante de sa vision. Pour cela on dfinit deux caractres X et Y. X prend les valeurs 1, 2 ou 3 selon que l'individu est plus habile de la main droite, est ambidextre ou est plus habile de la main gauche tandis que Y prend les valeurs 1, 2 ou 3 selon que l'individu a une meilleure vision de lil droit, gale des deux yeux ou a une meilleure vision de lil gauche. On veut tester l'hypothse Ho d'indpendance entre X et Y, au seuil 0,05. On note dans le tableau de gauche les rsultats obtenus en observant 413 personnes: X/Y 1 2 3 X/Y 1 2 3 1 34 62 28 1 2 27 28 20 2 3 57 105 52 3 a) Calculer les effectifs marginaux et en dduire les effectifs thoriques sous l'hypothse Ho, qui seront placs dans le tableau de droite. b) Les rsultats permettent-ils d'accepter Ho?

page 64

UV SQ 20

2) Eat-Parade des compagnies ariennes: Des rapports rcents indiquent que les repas servis pendant les vols dans diffrentes compagnies ariennes sont nots sans tenir compte des autres facteurs (confort de la cabine, retards, ). Une tude sur un chantillon alatoire de passagers qui on a demand de noter le repas a donn les rsultats suivants : A B C D mauvais 42 35 22 23 acceptable 50 75 33 28 bon 10 17 21 18 Peut-on considrer quil y a une diffrence de qualit entre les diffrentes compagnies ariennes (au seuil = 0,01) ?

-IV-

Tests d'homognit:

1) On a constat sur les tlviseurs dune marque que 30% des pannes provenaient du tube cathodique, 55% des composants lectroniques et 15% de problmes divers. Sur un chantillon de 200 postes en panne dune marque concurrente, on a 42 pannes du tube cathodique, 132 pannes dues aux composants et 26 pannes diverses. Les deux marques diffrent-elles (au risque 0,05) ? 2) La rpartition de la population franaise adulte selon 5 catgories professionnelles est la suivante : 15% 10% 30% 24% 21% Un chantillon de 800 personnes a donn la rpartition : 113 61 236 215 175 Tester laide du la reprsentativit de cet chantillon. 3) Un gnticien prtend que quatre espces de drosophiles (mouches du vinaigre) devraient apparatre dans les rapports 1:3:3:9. On suppose quun chantillon de 4 000 drosophiles contient 226, 764, 733 et 2 277 mouches des quatre espces. Peut-on, au risque 0,1, rejeter laffirmation du gnticien ? 4) On prouve l'homognit de rsultats observs, en comparant aux rsultats thoriques. Le tableau suivant donne des statistiques des concours d'entre l'E.N.A pendant 13 annes:

Distr. Th. Nb candidats Nb d'admis 575 48 988 89 2 244 180 209 17 210 18 287 13 423 37 961 43 5 897 445 a) Calculer la distribution thorique en cas d'homognit. b) Peut-on considrer, au niveau 95%, que la rpartition des admis est la mme que celle des candidats, ou que la profession des parents n'a rien aucune influence dans la russite ? c) Une analyse plus fine des rsultats de cette tude montre que la catgorie 8 influence nettement le calcul et l'interprtation. La conclusion est-elle diffrente si on exclut cette catgorie de la statistique ? Profession des parents 1- Professions librales 2- Commerce industrie 3- Fonctionnaires 4- Banques assurances 5- Artisans P.M.E. 6- Agriculteurs 7- Propritaires rentiers 8- Professions inconnues

-V- Problmes:
page 65

SQ-20 Probabilits - Statistiques

Problme 1:
La direction nationale d'un constructeur automobile A a men une enqute sur la dure de vie, exprime en milliers de km, sur un chantillon de 500 voitures du modle 1990 quipes de moteurs essence. Les rsultats de l'enqute sont consigns dans le tableau:

dure de vie 70 80 90 100 110 120 130 140 150 160 170 nb de vhicules 4 6 14 60 68 110 70 75 57 26 6 4
a) Montrer graphiquement qu'on peut considrer la dure de vie comme tant normale. b) Estimer, l'aide du graphique, les paramtres de cette loi. c) Dterminer une estimation de la proportion de vhicules de cette marque ayant une dure de vie suprieure 130 000 km et un intervalle de confiance de cette proportion au niveau 0,95. d) Un concurrent B fait effectuer dans les mmes conditions la mme enqute, sur 300 vhicules et constate que 198 d'entre eux n'ont pas dpass 130 000 km. Peut-on considrer, au risque de 0,05 que les proportions pour ces deux constructeurs soient identiques ? e) Une enqute de A sur 500 modles de 1980 avait donn une moyenne de 117 000 km, l'cart type tant le mme. Peut-on dire au seuil de 5% que la longvit se soit modifie au cours de ces 10 ans ?

page 66

UV SQ 20

Chap.10

Problmes dapprofondissement

Ce chapitre comporte des problmes plus difficiles que ceux qui correspondent au programme de lUV. Il existe parfois des tudiants assez curieux (ce qui nest pas un vilain dfaut dans les tudes) pour en savoir un peu plus. Ils trouveront ici des prolongements au cours de Probabilits et Statistiques.

-I- Liens entre diffrentes lois :


1) La fonction : On dfinit la fonction Gamma par z ( D) domaine de C, ( z) = a) Dterminer les valeurs relles de z pour lesquelles cette fonction est dfinie. b) Dterminer le domaine (D) du plan complexe sur lequel (z) existe. c) Montrer la relation z C / z 1 ( D) , ( z) = ( z 1) ( z 1) . d) En dduire les valeurs de la fonction pour les valeurs entires non nulles de z. 2) Liens entre les lois exponentielles, les lois Gamma et la loi du . On rappelle que si X est normale centre rduite, alors Y=X suit une loi un degr de libert. a) Calculer la densit de Y, puis en dduire sa fonction caractristique. b) En dduire la fonction caractristique de la loi n degrs de libert, pour n entier non nul. c) Soit la suite (Tk)kN* de variables exponentielles indpendantes de paramtre >0. Ecrire la densit des Tk, puis leur fonction caractristique. d) On considre les sommes S n = Montrer
fn ( t) =
n

t z 1 e t dt .

T
k =1

pour n entier suprieur ou gal 1. suit une loi (,n) (loi Gamma) de densit

par

rcurrence

que

Sn

t e 1R + ( t ). ( n) Calculer la fonction caractristique de Tk et en dduire celle de Sn .

n 1 t

e) Comparer les fonctions caractristiques de 2 n et de 2

FG 1 , nIJ . Que peut-on en dduire pour ces H2 K

deux lois ? Retrouver les valeurs de lesprance et de la variance du 2n d de libert. 3) Lien entre la loi de Poisson et les lois exponentielles : On considre un vnement (par exemple panne dune machine) qui peut se produire un instant t>0 quelconque, et la variable alatoire T, temps dattente avant que cet vnement se produise. On suppose que T suit une loi E(). On note Zn linstant darrive du nme vnement. a) Montrer que Zn suit une loi (,n). b) Pour zR+, calculer la probabilit que n vnements se produisent dans lintervalle [0, z]. c) Si N est le nombre dvnements survenant dans [0, z], dterminer la loi de N. d) En dduire la relation suivante :

k e = p (1, n + 1) > = 1 k! k =0
n

Xte Y n! Z
0

n t

dt .

page 67

SQ-20 Probabilits - Statistiques

4) Lien entre la loi de Poisson et la loi : a) Soit la variable alatoire U qui suit une loi (,n). Dterminer, pour a > 0, la densit et la nature de la variable V = a U. b) N tant une variable de Poisson P(), montrer partir de 3), la relation p N n = p 2 n + 2 > 2 . 2 (Cette relation peut tre utilise quand on cherche les probabilits cumules dune loi de Poisson, pour un paramtre trop grand pour figurer dans les tables).

g c

-II- Fonctions gnratrices


1) On considre une v. a. X valeurs dans N[0, n] et le polynme P par P( x) = p( X = k ) x k .
k =0 n

(La fonction polynme ainsi dfinie est appele fonction gnratrice de X). a) Calculer P(1), puis P(1) et P"(1). En dduire E(X) et Var(X) en fonction de P. b) Dans les cas suivants, dterminer la fonction gnratrice et retrouver l'esprance et la variance des variables alatoires. X est une variable uniforme sur {1, 2, , n} (on pourra poser p(X = 0) = 0). X est une variable binomiale de paramtres n et p.

2) (Pour les tudiants ayant suivi MT 26) On veut montrer qu'on peut gnraliser ce procd N. a) Soit X une variable alatoire discrte valeurs dans N. Montrer que le domaine de convergence p( X = n) x n contient [0, 1[. de la srie entire S( x) =

n0

b) En dduire que S est deux fois drivable sur [0, 1[. c) Quand lesprance et la variance existent, les exprimer en fonction de f et de f . d) Dans les cas suivants, dterminer la fonction gnratrice et retrouver l'esprance et la variance des variables alatoires, si elles existent. X est une loi de Poisson de paramtre X est une loi gomtrique de paramtre p. 4 X est une variable dfinie par n N , p( X = n) = ( n + 1)( n + 2)( n + 3)

-III- Problmes
1) On sintresse au retard par rapport la dure de voyage prvue pour un voyage de 500 km par le t 2 e 0 ,5 t train. Ce retard R (exprim en minutes) suit une loi de densit h( t ) = 1R + ( t ) . 16 a) Montrer que h dfinit effectivement une densit de probabilit. En calculer lesprance et la variance. b) Sachant que la densit de la loi n degrs de libert est f n ( t ) = suit une loi dont on dterminera le degr de libert. t2 e 22
n n 1

b g1
n 2

t 2

R+

( t ) , montrer que R

page 68

UV SQ 20

Chap.11

Corrigs d'exercices

-I- Corrigs des exercices


1) Exercice Erreur ! Source du renvoi introuvable. page Erreur ! Signet non dfini.: a) Dans ce cas, on affecte un numro de 1 N chacune des n particules, supposes numrotes et donc 1 = x1 ,K , x n , x k {1,K , N} et Card 1 = N n . On choisit ensuite k particules pour la premire bote

mb

(non ordonnes) et on rpartit les nk autres dans les N1 botes restantes. On a donc: nk k n k Ck N 1 1 1 n re = Ck 1 p( k particules dans la 1 bote) = pour k{0,, n} n Nn N N b) Dans ce cas, on ne s'intresse qu'aux nombres de particules dans les botes. On peut reprsenter une rpartition des particules par une suite de la forme || || || avec n (particules) et N1 | (cloisons)., ce qui donne (n+N1)! possibilits. Mais comme les cloisons et les particules sont indiscernables, on peut les n + N 1 ! permuter et on a finalement: Card ( 2 ) = = C n + N 1 . De mme que pour a), on a k boules dans la n n!( N 1)!

FG IJ FG H KH

IJ K

premire bote et on doit rpartir les nk dans N1 botes, ce qui donne p( k part. dans la 1re bote) =

C n-k n+N-2-k Cn n+N-1

pour k{0,, n}. c) Ici, on rpartit n particules dans N botes sans tenir compte de l'ordre, et si la premire bote contient une C n-1 n p( k part. dans la 1re bote) = N-1 = . particule, on rpartit les n1 dans les N1 botes et donc: n CN N
2) Corrig de lexercice Erreur ! Source du renvoi introuvable. page Erreur ! Signet non dfini. . a) Le tirage tant simultan de 3 lments / 36, on a: = x1 , x 2 , x 3 , x1 , x 2 , x 3 dans 1, K ,36 et

ml

qr

Card () = C = 7140 . On peut supposer l'quiprobabilit des tirages.


3 36

36 - 2x

b) Pour x = 6, on a p(A ) = p( BNR ) =

6 6 24 72 = 0,012 . 595 C3 36
12

c) Etude de f: f ( x) = 36x 2 2 x 3 f '( x) = 6 x (12 x) d) Par un calcul analogue celui de b), on a : x 2 (36 2 x) f ( x) p( x) = p( A ) = = 3 maximale pour x = 12. (p 0,24) C3 C 36 36 e) Dans le cas n = 12, X suit une loi hypergomtrique H(N=36, n=5, p=0,4) (tirages simultans). f) p(A| X = 1) =

p(A ( X = 1)) p( A ) p(12) = = 0,5217 . et donc p(A | X=1) 0,5217 . p( X = 1) p( X = 1) 12 C 2 24 C3 36

Si A est ralis, alors il y a un poisson de chaque couleur, et donc, ncessairement X = 1. Donc p(X=1 | A) = 1.
3) Exercice Erreur ! Source du renvoi introuvable. page Erreur ! Signet non dfini. . La situation peut se reprsenter par le graphique suivant:
page 69

SQ-20 Probabilits - Statistiques

tape

1 0,5

2 A
(0,25

n 0,5

n+1 B C A C A
0,5 an

an
0,5

A
0,5 0,5 an 0,5 bn 0,5 bn 0,5 cn

B
0,5 0,5

C A

(0,25) (0,25)

bn
B

0,5 0,5

0,5

C
0,5 0,5

(0,25)

cn

C
0,5

0,5 cn B On a donc entre les probabilits les relations suivantes, qu'on peut mettre sous forme matricielle. La matrice A tant symtrique, elle est diagonalisable: a n +1 = 0,5 b n + 0,5 c n a n +1 0 0,5 0,5 a n b n +1 = 0,5 a n + 0,5 c n et b n +1 = 0,5 0 0,5 b n ou U n +1 = A U n . c n +1 = 0,5 b n + 0,5 a n c n +1 0,5 0,5 0 c n

R | S | T

F GG H

I JJ K

F GG H

0 1 1 1 1 0 , P = 1 0 1 et U 0 = 0 . 0,5 1 1 0 0 La situation la premire tape est donc: probabilits 0 pour A, 0,5 pour B et pour C. - - - - - deuxime tape - - - - - - - - 0,5 pour A, 0,25 pour B et pour C 1 + 0,5n 1 1 + 0,5n 1 0,5n 1 0,5n 1 1 1 ce qui donne U n = 1 0,5n 1 + 0,5n 1 0,5n 0 = 1 0,5n . Donc quand n tend vers l'infini les 3 1 0,5n 3 1 0,5n 1 0,5n 1 + 0,5n 0

On a donc: U n = A n U1 = P D n P 1 U 0

IF I JJ GG JJ KH K F1 0 avec D = G 0 0,5 GH 0 0
IF I JJ GG JJ KH K
3

I JJ K

F GG H

I JJ K

FI GG JJ HK

F GG H

F GG H

I JJ K

trois probabilits tendent vers 1/3. Logiquement, long terme, on ne peut pas savoir o sera le chariot.
4) Exercice Chap.2 -VI- 2) page 24. a) Les tirages tant indpendants, =

mbx , x , x g / 0 x n 1, x entierr et donc Card() = n . Les valeurs possibles de X et Y sont les entiers de 0 9. F xI b) Pour x l0,K , nq on a pb X < xg = 1 pb X xg = 1 G 1 J . En effet, si inf(x , x , x ) x, alors ils H nK
3 1 2 k k n

sont tous les trois dans l'ensemble {x, x+1, , n}, ils sont donc choisis parmi (nx) numros. y3 Pour Y on a, par un raisonnement analogue y 0,K , n p(Y < y) = 3 . n 3 3 n x 1 nx c) D'aprs b), p( X = x) = p( X < x + 1) p( X < x) = 1 1+ . n n

q FG IJ FG IJ H K H K F y + 1IJ FG y IJ = 3y + 3y + 1 De mme: p(Y = y) = p(Y < y + 1) p(Y < y) = G H n K H nK n


3 3 2 3

3( n x) 2 3( n x) + 1 3y 2 + 3y + 1 et p(Y = y) = On a donc : p( X = x) = n3 n3 d) Pour n = 10, les calculs donnent


x p(X=x) x p(X=x) (x-E(X)) p(X=x) 0 1 2 3 4 5 6 7 8 9 0,271 0,217 0,169 0,127 0,091 0,061 0,037 0,019 0,007 0,001 0 0,217 0,338 0,381 0,364 0,305 0,222 0,133 0,056 0,009 1,111 0,228 1E-04 0,121 0,355 0,54 0,585 0,47 0,25 0,049 Total 1 2,0250 3,7084

page 70

UV SQ 20 y p(Y=y) y p(Y=y) (y-E(Y)) p(Y=y) 0 1 2 3 4 5 6 7 8 9 0,001 0,007 0,019 0,037 0,061 0,091 0,127 0,169 0,217 0,271 0 0,007 0,038 0,111 0,244 0,455 0,762 1,183 1,736 2,439 0,049 0,25 0,47 0,585 0,54 0,355 0,121 1E-04 0,228 1,111

1,0000 6,9750 3,7084

donc E(X) = 2,025, E(Y) = 6,975 = 9 E(X) et Var(X) = Var(Y) = 3,7084


5) Exercice Chap.2 -VI- 15) page 26. Pour tudier la loi de Y, on doit calculer, pour tout yN, p(Y=y). Comme Y suit une loi B(n,p), il est ncessaire que XY, et donc : y+ k e y y k p( Y = y) = p(Y = y X = y + k ) = p(Y = y| X = y + k ) p( X = y + k ) = C y + k p (1 p) ( y + k )! k =0 k =0 k =0

( p) y ( (1 p)) k e ( p) y e et, aprs simplification p(Y = y) = = y! k ! y! k =0

b(1 p)g = bpg e

( p )

k =0

k!

y!

ce

qui montre que Y suit une loi de Poisson de paramtre = p . 6) Exercice Chap.4 -III- 2) page 34 . a) On se place dans [0, +[ pour les variables t et y. Connaissant la densit et la f. r. d'une loi exponentielle, on a :
G 2 ( y) = p Y2 < y = p X < y 2 = F(y 2 ) = 1 e y et donc g 2 ( y) = 2ye y

g d
n

b) Un calcul analogue donne, pour G n ( y) = p Yn < y = p X < y n = F(y n ) = 1 e y et g n ( y) = ny n 1e y c) Si ]0,+1[ ( n) = p Yn 1 > = 1 p 1 < Yn < 1 + = 1 G n (1 + ) + G n (1 ) et donc

g d

( n) = 1 + e (1+ ) e (1 ) et donc lim ( n) = 1 + 0 1 = 0 ce qui montre que Yn prob Y = C(1) , variable


n

certaine C(1) dfinie par p(Y=1) =1 et p(Y1) = 0. Si Gn est la fonction de rpartition de Yn , on a lim G n ( y) = lim 1 e
n n
y n

qu'en tout point de continuit de H (dfinie par H(y) = 0 si y 1 et H(y) = 1 si y > 1) Gn(y) tend vers H quand n tend vers . On a donc la convergence en loi de Yn vers Y. On peut se rendre compte de cette convergence en reprsentant graphiquement les fonctions gn et Gn .

R0 si y < 1 | = S1 e si y = 1 , ce qui montre |1 si y > 1 T

densits fonctions de rpartition d) Vous pouvez essayer de faire le reste sans aide. A chacun son tour de travailler !.
7) Exercice Chap.5 -V- 9) page 44. 1 n a) Estimateur de p : F = X = X k o les Xk sont des B(1,p) indpendantes. Dans ces conditions n k =1 S = X k est binomiale B(n,p) avec E(S) = np et Var(S) = np(1-p). D'aprs les proprits de l'esprance et de la

Variance, on a:
page 71

SQ-20 Probabilits - Statistiques

F + IJ . F est donc un estiSi F = F + F on a E( F) = p + p = ( + ) p et Var ( F) = p(1 p)G Hn n K mateur sans biais ssi + = 1 donc = 1 . F + (1 ) IJ = f () minimale pour Rf '() = 0 . La rsolug) Pour = 1 on a Var ( F) = p(1 p)G Sf "() > 0 Hn n K T
2 2 1 2 1 2 2 2 1 2

p(1 p) n 0 . F est donc un estimateur sans biais et convergent . n 1 n1 1 n2 p(1 p) p(1 p) D'aprs les donnes: F1 = X k , F2 = X'k , Var ( F1 ) = n , Var ( F2 ) = n . n 1 k =1 n 2 k =1 1 2 E( F) = p et Var ( F) =

n1 n2 n1 n2 et = et F = F1 + F2 . Tout se n1 + n 2 n1 + n 2 n1 + n 2 n1 + n 2 passe en ralit comme si on runissait les deux chantillons pour n'en faire qu'un seul de (n1 + n2) lments. h) Estimation ponctuelle avec les donnes fournies: 500 1000 f = estimation de p = 0,3 + 0,23 = 0,303 1500 1500

tion (facile) du systme donne =

8) Exercice Chap.5 -V- 11) page 45 . Fonction de vraisemblance de cet chantillon :


L( x1 ,K , x n , m) =

k =0

R ln L = bx mg = 0 | On a donc les quations de vraisemblance : | m x S ln L | = n < 0 | m T


n k 2 k =1 2

1 ( x k m) e 2 = 2

FG H

1 2

IJ e K
n
n k =1

( x k m) 2 2

n avec ln L = ln2 2

( x k m) 2 . 2 k =1
n

= nm m =

1 n

x
k =1

Lestimateur de maximum de vraisemblance de m est donc T(X1 ,K , X n ) = 9) Exercice Chap.6 -VI- 8) page 50.

1 n

X
k =1

On a donc p estim par f = 85/400 = 0,2125 . Variable de confiance Y = donc p( 196 < Y < 196) = p F 1,96 . . b) Pour une longueur 0,04 il faut x
10)

F GH

0,167 0,167 < p < F + 1,96 400 400

I et donc I = ] 0,1724 , +0,2526[ JK

F p N (0, 1) , et p(1 p) / 400

0,167 = 0,02 et x = 0,979 ce qui donne 1-/2=0,836 et =0,33. 400

Exercice Chap.7 -VII- 7) page 53. a) Dans le cas o Mo > 20, on est en prsence d'un test unilatral droite. La variance tant connue, la varia-

ble

X 20 X 20 = 3 0,3 30 a 20 p( X < a ) = 0,95 p Y < = 0,95 . 0,3

de

test

Y=

est

N(0,

1).

On

cherche

donc

tel

que

F GH

I JK

On a donc a = 20,9, et le domaine d'acceptation de H0 est : Do = ]-, 20,9[ = I .

page 72

UV SQ 20

b) Pour Mo = 21, on a = p X < 20,9| M = 21 = p X 21 < 20,9 21 = p Y < 0,183 = 0,4276 . En refaisant

h FGH

0,3

0,3

IJ b K

le mme calcul pour des valeurs diffrentes de Mo, on a le tableau suivant, qu'on peut complter par symtrie / 20 : Mo 20 20,25 20,5 (19,5) 20,75 21 (19) 21,25 21,5 22 (19,75)
20,9 M 0 0,3

1,645

1,187

0,730

0,274

- 0,183

-0,639

-1,095

-2 0,022 0,978

0,95 0,882 0,767 0,608 0,428 0,262 0,139 0,05 0,118 0,233 0,392 0,572 0,738 0,861 1 a) On a donc la reprsentation graphique: Courbe de puissance (sommet = minimum)
1,2000 1,0000 0,8000 0,6000 0,4000 0,2000 0,0000
18 18,3 18,5 18,8 19 19,3 19,5 19,8 20 20,3 20,5 20,8 21 21,3 21,5 21,8 22

11)

Exercice Chap.7 -VII- 8) page 53 a) Si X est normale et les v. a. de l'chantillon indpendantes, on a X N ( M , 2 = 25 ) et donc on a la variaX n ble de test: (unilatral)
Y= X 10
25 30

N (0,1) et donc p X (D 0 ) = p

F I h G X 10 < 1,645J = 0,95 d' o (D ) = ;+ 11,5 . L'observation ayant H K


25 30 0

donn une moyenne de 11, on accepte l'hypothse Ho. b) Le test tant unilatral du mme ct, le domaine et la dcision sont les mmes. Mais l'hypothse (H1) tant , avec simple, on peut dfinir un risque
= p X D 0 | M = 11 = p

F I h G X 11 < 11,5 11J = pbN(0,1) < 0,548g = 0,708 . H K


25 30 25 30

du

c) Dans cette question, on impose = 0,1 et on cherche n. On doit donc avoir, avec un calcul identique celui a),

( D 0 ) = ,+10 + 1,96

OP Q

10 + 1,96 5n 11 5 . et donc 0,1 = p( N (0,1) < 1,28) = p X ( D 0 )| M = 11 = p N (0,1) < 25 n n

LM N

F h G H

I JK

On a donc la relation: 1 + 1,96


12)

5 n

= 1,28

5 n

, ce qui nous donne un chantillon de taille n = 263 .

Corrig de lexercice Chap.7 -X- 1) page 55 chantillon de taille n = 40 et test H0 : M = 240 contre H1 : M 240 , variable de test Y = X 240 N (0,1) .
50 40

(La loi est normale car la variance est connue) D0 dfini par 240 1,96

0,05. Pour = 0,01, on remplace 1,96 par 2,57, ce qui agrandit D0, et cette fois-ci on accepte H0.

OP Q

50 50 , 240 + 1,96 = 224,5 ; 255,5 et 260 D0. , donc on rejette H0. pour = 40 40

LM N

page 73

SQ-20 Probabilits - Statistiques

13)

Exercice Chap.9 -II- 3) page 63 avec les donnes de l'exercice Chap.9 -I- 1) On peut effectuer des estimations par le calcul ou laide de la droite de Henry x 24,7 utilise la moyenne et la variance calcules partir du tableau. La rduction x'i = i 1,44
centre 20,5 21,5 22,5 23,5 24,5 25,5 26,5 27,5 28,5 n= ni 2 4 13 40 65 52 18 6 6 206 ni c i 41 86 292,5 940 1592,5 1326 477 165 171 5091 x= var = cart type ni (ci-moy) rduction loi N(0,1) 35,5 41,3 63,7 58,9 3,0 32,2 57,4 46,6 86,0 424,6 24,71 2,06 1,44 -2,59 -1,89 -1,19 -0,50 0,20 0,90 1,59 2,29 0,0048 0,0294 0,1163 0,3096 0,5791 0,8149 0,9444 0,9890 1,0000 distance d libert table chi 2 pi 0,0048 0,0245 0,0870 0,1933 0,2695 0,2358 0,1295 0,0446 0,0110 6,06 4,00 9,5 13,3 n pi 1,00 5,05 17,91 39,81 55,51 48,58 26,67 9,19 2,27 21 22 23 24 25 26 27 28 29 () Total

page 62

Intervalles 20 21 22 23 24 25 26 27 28

regr. 6,05 17,91 39,81 55,51 48,58 26,67 11,46

chi 2 0,00 1,35 0,00 1,62 0,24 2,82 0,03 6,06

moyen ne:

0,05 0,01

dcision Ho

On doit donc accepter l'hypothse nulle, c'est dire que la srie est normale d'esprance 24,7 et de variance 2,06, ce qui confirme l'tude graphique.
14) Corrig de lexercice Erreur ! Source du renvoi introuvable.page Erreur ! Signet non dfini.: Tableau de gauche : rsultats obtenus tableau de droite : rsultats thoriques : X/Y X/Y 220 290 28 237,8 282,9 299,3 45 40 20 37,7 44,85 47,45 25 15 52 14,5 17,25 18,25 On a donc le test : H0 : indpendance contre H1 : dpendance Variable de test D 2 dobservation d = 15,58. 4 Daprs la table, on trouve 0,95 9,49 et donc on rejette lindpendance.

page 74

UV SQ 20

Chap.12

Exercices du cours

1) On mesure la dure de vie, dans des conditions normales de 100 piles lectriques et on obtient les rsultats suivants: dure de vie en h 80 100 120 140 160 180 200 220 240 nb de piles 2 2 16 28 30 15 5 2 a) Calculer la moyenne et l'cart type de cette srie. b) Peut-on considrer au seuil de 0,05 que la dure de vie des piles suit une loi normale dont les paramtres sont dterminer. c) Vrifier graphiquement l'ajustement et retrouver les estimations de la moyenne et de .

page 75

SQ-20 Probabilits - Statistiques

Chap.13

Rserve dexos

1) On organise un sondage en vue d'une lection, en soumettant un chantillon reprsentatif de 1 000 personnes le questionnaire suivant: Si votre anne de naissance est bissextile rpondez (1) sinon rpondez (2). (1) Etes-vous n en mai ? (2) Voterez-vous pour Monsieur Lajoie ? Le sondage a donn 450 "OUI" et 550 "NON". Monsieur Lajoie a-t-il des chances d'tre lu ? 2) L'ensemble des professeurs qui assurent la prparation d'un examen peut-tre, en premire approximation, partag en bons professeurs, et mauvais professeurs. On considre les vnements suivants: A = "le professeur est bon" et B = "le candidat est reu son examen", ainsi que les probabilits: p(A) = 0,3 , p(AB) = 0,24 et p( A B) = 0,35 . a) Calculer les probabilits : p( B) , p( B A ) et p( B A ) . b) Un candidat a t reu. Calculer la probabilit de l'vnement: "le professeur tait bon". c) On apprend qu'un professeur a vu au cours des dernires annes 70% de ses lves reus l'examen, quel est le choix le plus judicieux: s'adresser lui pour la prparation l'examen ? laisser faire le hasard pour le choix du professeur ? d) Un bon professeur considre 4 de ses lves. Calculer la probabilit qu'au moins trois soient reus. 3) Une compagnie de transport envisage de squiper avec un nouveau modle de pneus pour ses camions. Le propritaire dcide deffectuer un test sur une petite partie de sa flotte de camions. Sil ny a pas plus de trois pneus crevs sur 100 000 kilomtres, le nouveau pneu sera accept. a) Quelle est la probabilit dacceptation si la probabilit de crevaison est de 0,02 pour 1000 km ? b) - - - - - - - - - - - - - - - - - - 0,1 - - ?

page 76