Professional Documents
Culture Documents
Sommaire
1. Prérequis
2. Lois normales
3. Intervalles de fluctuation
4. Estimation
5. Synthèse de la séquence
Séquence 9 – MA02 1
2 Séquence 9 – MA02
B Probabilité
1. Espérance et écart-type d’une variable
aléatoire
On rappelle que, dans le cas fini, on a la propriété suivante.
Propriété
Signalons que l’on dit aussi « moyenne » pour désigner l’espérance d’une
variable aléatoire.
2. Loi binomiale
Définition
Séquence 9 – MA02 3
0,200
0,150
probabilité
0,100
0,050
0,000
0 1 2 3 4 5 6 7 8 9 1011121314151617181920
k
Utiliser une calculatrice ou un tableur.
Avec un tableur
Soit X une variable aléatoire suivant la loi binomiale de paramètres n et p.
t La syntaxe LOI.BINOMIALE(k ; n ; p ; FAUX) ou LOI.BINOMIALE(k ; n ; p ; 0)
renvoie la probabilité P ( X = k ).
t La syntaxe LOI.BINOMIALE(k ; n ; p ; VRAI) ou LOI.BINOMIALE(k ; n ; p ; 1)
renvoie la probabilité cumulée P ( X ≤ k ).
Avec une calculatrice TI (84, mais aussi 83 et 82 Avec une calculatrice Casio
avec des modifications mineures) (graph 35+ ou plus)
Pour calculer P ( X = k ) lorsque X suit la loi Pour calculer P ( X = k ) lorsque X suit la loi
binomiale B(n ; p ), on utilise l’instruction binomiale B(n ; p ), on utilise le menu STAT,
binomFdp( (que l’on obtient par l’instruction on choisit DIST (touche F5) puis BINM (touche
DISTR (touches 2ND VARS) et la touche 0) que F5), Bpd (touche F1) et Var (touche F2).
l’on complète ainsi : binomFdp(n, p, k).
On renseigne la boîte de dialogue : Data :
Ces calculatrices donnent aussi les probabilités variable ; valeur désirée : k ; Numtrial : n ; pro-
P ( X ≤ k ) par l’instruction binomFREPdp(. babilité : p.
Avec une calculatrice Casio graph 25+Pro, pour
calculer P ( X = k ), il faut taper la formule ou
avoir implémenté un programme.
4 Séquence 9 – MA02
Définition
Définition
Soit f une fonction, définie sur I, qui est une densité de probabilité sur I.
On dit que la variable aléatoire X suit la loi de densité f sur l’intervalle I
lorsque, pour tout événement J inclus dans I, la probabilité de l’événement
( X ∈ J) est la mesure, en unités d’aire, de l’aire du domaine :
{M ( x ; y ) ; x ∈ J et 0 ≤ y ≤ f ( x )}.
O c i d
Propriété
d
t Pour tout intervalle J = [c ; d ] de I, on a : P (c ≤ X ≤ d ) = ∫ f ( x ) d x .
c
t Pour tout réel α de I, on a : P ( X = α ) = 0.
Séquence 9 – MA02 5
Pour deux intervalles J et J’, inclus dans I, tels que J′∩ J = ∅, on a :
P ( X ∈ J ∪ J′) = P ( X ∈ J′) + P ( X ∈ J) .
Propriété
( )
Soit J un intervalle, on a : P X ∈ J = 1− P ( X ∈ J) .
C Échantillonnage
En statistiques, un échantillon de taille n est la liste des n résultats obtenus par
n répétitions indépendantes de la même expérience aléatoire. Ici l’expérience
répétée est une épreuve de Bernoulli, c’est-à-dire qu’elle ne prend que deux
valeurs : échec / réussite, oui / non, homme / femme, 0 / 1…
Par exemple, un échantillon de taille 100 du lancer d’un dé dont on observe
l’apparition ou non de la face 6 est la liste des résultats obtenus en lançant 100
fois le dé. Pour chaque lancer la probabilité de réussir (d’obtenir la face 6) est p,
1
la probabilité de l’échec (ne pas obtenir 6) est 1− p ( p = si le dé est bien
équilibré). 6
Définition
On a vu en Seconde que :
L’intervalle p −
1 1
;p+ est un intervalle de fluctuation approché au seuil
n n
de 95 %, relatif aux échantillons de taille n.
Commentaire Dans certains cas, la probabilité que la fréquence appartienne à l’intervalle
1 1
p − n ; p + n est très proche de 0,95 mais en étant inférieure, c’est
pourquoi on dit que ce sont des intervalles de fluctuation « approchés ».
6 Séquence 9 – MA02
Séquence 9 – MA02 7
B Pour débuter
Activité 1 Centrer et réduire
Définition 1
On dit qu’une variable aléatoire est centrée et réduite lorsque son espérance
est nulle et son écart-type égal à 1.
8 Séquence 9 – MA02
Loi binominale
Loi binominale n=50 p=0,7
n=40 p=0,2 0,140
0,18 0,120
0,16
probabilité P(X=K)
probabilité P(X=K)
0,14 0,100
0,12
0,080
0,1
0,08 0,060
0,06
0,040
0,04
0,02 0,020
0
0
2
4
6
8
10
12
14
16
18
20
24
26
22
0
0
3
6
9
12
15
18
21
24
27
30
33
36
39
42
45
48
Valeurs de k Valeurs de k
Les lois, donc les représentations graphiques, dépendent des valeurs des para-
mètres n et p, mais on observe, ici et aussi sur la représentation donnée dans les
prérequis, une grande ressemblance entre ces graphiques. Toutes les représenta-
tions graphiques des lois binomiales sont analogues.
Il semble que la probabilité maximum (le bâton de plus grande ordonnée) est
obtenue pour la valeur moyenne, pour l’espérance qui vaut np.
On associe à chacune de ces lois B(n ; p ) une autre loi, centrée et réduite.
0,93
1,54
2,16
2,78
3,39
4,01
4,63
0
Valeurs de Z
Toutes les variables aléatoires Z centrées réduites définies à partir d’une loi bino-
miale ont des représentations graphiques qui ont la même allure. Elles sont seu-
lement plus ou moins « étalées », le maximum est plus ou moins grand.
Séquence 9 – MA02 9
Les sommets des bâtons semblent dessiner une courbe, qui est de plus en plus
« visible » quand n grandit.
Pour définir cette courbe, puis utiliser une probabilité à densité, on change de
représentation. On passe des diagrammes en bâtons où les probabilités sont
représentées par la hauteur des bâtons, à des rectangles où les probabilités sont
représentées par les aires des rectangles.
Les deux représentations sont illustrés ci-dessous sur un exemple où n n’est pas
très grand.
O 1
densité
loi de X : B(n,p)
n = 20 et p = 0,7
Z = (X–14)/ 4,2 probabilité : 0,025
O 1
10 Séquence 9 – MA02
x2
1 −2
Activité 3 Étude de la fonction définie sur par f ( x ) = e
2π
(complément de l’exercice 16 de la séquence 7 ).
Montrer que cette fonction est paire.
Étudier la limite de f en +∞ et en −∞.
Séquence 9 – MA02 11
C Cours
1. Théorème de Moivre-Laplace
Le paramètre p est fixé, l’entier n varie, les variables aléatoires X n suivent les
lois binomiales B(n ; p ).
On utilise les variables aléatoires centrées et réduites correspondantes Z n .
t la largeur des rectangles est de plus en plus petite ;
t les aires des rectangles, c’est-à-dire les probabilités, deviennent de plus en
plus proches des aires correspondantes limitées par la courbe représentant la
fonction f et l’axe des abscisses : les probabilités P (a ≤ Z n ≤ b ) sont de plus
x2
b 1 −
en plus proches de ∫a 2π
e 2 dx .
n = 99
0,5
p = 0,34
0,4
0,3
0,2
0,1
0
–4 –3 –2 –1 0 1 2 3 4
12 Séquence 9 – MA02
Propriété 1
x2
1 −
La fonction définie sur par f ( x ) = e 2 est une densité de proba-
bilité. 2π
La fonction a été étudiée dans l’activité 3. C’est une fonction continue à valeurs
positives, on admet que l’aire sous la courbe est égale à 1u.a.
1/ 2/ 0,4
O 1
Séquence 9 – MA02 13
Propriété 2
Soit X une variable aléatoire qui suit la loi normale N (0 ; 1), on a :
t pour tout réel u positif, P ( X ≤ −u ) = P ( X ≥ u ) ;
1
t P ( 0 ≤ X ) = P ( X ≥ 0 ) = .
2
Démonstration
t La fonction de densité de la loi normale N (0 ; 1) est paire, donc, par symétrie,
les mesures des aires égales aux probabilités P ( X ≤ −u ) et P ( X ≥ u ) sont
égales, P ( X ≤ −u ) = P ( X ≥ u ).
Ꮿf P(X u)
P(X –u)
–u O u
14 Séquence 9 – MA02
Définition 3
Propriété 3
Démonstration
t2 t 2 x x2
1 x −2 1 −2 1 −2
=
2π
∫ 0
t e dt = −e =
2π
−e
2π
+ 1.
0
x
On étudie d’abord la limite
2
lim ∫ t f (t )dt
x →+∞ 0
par composition.
x
− x2
La fonction x e 2 est la composée de x − et de X e X , or
2
x2
lim − = −∞ et lim e X = 0, on peut donc écrire
x →+∞ 2 X →−∞
x2
− x2
lim e 2 = lim e X = 0 par composition avec X = − .
x →+∞ X →−∞ 2
Séquence 9 – MA02 15
Propriété 4
P(–u X u) = 1 – _
P(X –u) Ꮿf
P(X u)
–u O u
Théorème 2
Lorsque la variable aléatoire X suit la loi normale N (0 ; 1), pour tout nombre
α de l’intervalle ]0 ; 1[ , il existe un unique nombre réel positif u α tel que
P (−u α ≤ X ≤ u α ) = 1− α.
16 Séquence 9 – MA02
u 0 uα +∞
1
2H (u ) 1− α
0
Remarque On appelle « réalisation d’une variable aléatoire X » la valeur observée quand on
réalise concrètement l’expérience aléatoire.
3. Loi normale N (µ ; σ 2)
a) Définition, espérance, écart-type
Définition 4
Séquence 9 – MA02 17
ᏺ (3;0,25)
ᏺ (1;1)
ᏺ (0;1)
ᏺ (0;4) ᏺ (1;4)
O 1
On observe que chaque courbe est symétrique par rapport à la droite d’équation
x = µ.
Propriété 5
18 Séquence 9 – MA02
On choisit Distr (par 2nd Var) Dans le menu Stat, on choisit Distr, puis NormCD. On indique
puis normalcdf (ou, en français, les données dans l’ordre a, b, σ et µ (attention à ne pas
normalFRep). confondre σ et σ 2 ).
On indique les données dans Voici un exemple avec a = −1 b = 1, 5 µ = 3 et σ = 2 :
l’ordre a, b, µ et σ (attention à
ne pas confondre σ et σ 2 ).
Voici un exemple avec a = −1
b = 1, 5 µ = 3 et σ = 2 :
t P ( X ≤ c )
Les calculatrices étudiées ne font pas le calcul directement. On dispose de deux
méthodes.
On utilise l’approximation P ( X ≤ c ) ≈ P ( −1099 ≤ X ≤ c ) où on néglige
{
P ( X < −1099 ).
Ou bien on utilise des égalités, mais elles dépendent de la position de c par
{
Ꮿf
P(X +) P(+ X c)
+ c
Si c ≥ µ :
1
P ( X ≤ c ) = P ( X < µ ) + P (µ ≤ X ≤ c ) = + P (µ ≤ X ≤ c )
2
Séquence 9 – MA02 19
c +
Si c ≤ µ :
1
P ( X ≤ c ) = P ( X ≤ µ ) − P (c < X ≤ µ ) = − P (c ≤ X ≤ µ ).
2
On choisit Distr (par 2nd Distr) puis Dans le menu Stat, on choisit Distr, puis Inverse Nor-
invNorm (ou, en français, FracNorm), puis mal. On indique les données dans l’ordre p, σ et µ .
on donne p, µ et σ .
Voici un exemple avec p = 0,1 µ = 3 et σ = 2 :
Voici un exemple avec p = 0,1 µ = 3 et
σ = 2 :
20 Séquence 9 – MA02
ᏺ(+;0,25)
ᏺ(+;1)
ᏺ(+;4)
O +
On sait que l’écart-type σ mesure la dispersion des valeurs prises par la variable
aléatoire autour de son espérance µ. L’influence de l’écart-type sur la courbe est
très visible : plus il est important, plus la courbe est « étalée ».
Les résultats suivants doivent être connus, ils donnent une idée de la répartition,
autour de son espérance µ, d’une variable aléatoire X qui suit une loi normale
N (µ ; σ 2 ).
Séquence 9 – MA02 21
On a :
P (µ − σ ≤ X ≤ µ + σ ) ≈ 0,68 (à 10−2 près) ;
P (µ − 2σ ≤ X ≤ µ + 2σ ) ≈ 0,95 (à 10−2 près) ;
P (µ − 3σ ≤ X ≤ µ + 3σ ) ≈ 0,997 (à 10−3 près).
0,68
µ
µ– µ+
0,95
µ
µ–2 µ+2
0,997
µ
µ–3 µ+3
22 Séquence 9 – MA02
D Exercices d’apprentissage
Plusieurs exercices de cette séquence sont issus de documents ressources de
l’Éducation nationale.
Dans les exercices 1 et 2, on donnera des valeurs approchées à 10−4 près par
défaut.
Exercice 1 Soit X une variable aléatoire suivant la loi normale centrée réduite.
Calculer :
a) P ( −0, 5 ≤ X ≤ 1, 3) ; b) P ( X ≤ −1) ; c) P ( X ≥ 1, 8 ).
Déterminer le réel x tel que P ( X ≤ x ) = 0, 8.
Exercice 2 Soit X une variable aléatoire suivant la loi normale N (12 ; 9).
Calculer :
Séquence 9 – MA02 23
2
1 Ꮿ
O 1
4
Exercice 5 Une entreprise produit en grande quantité des pièces cylindriques. Soit X la
variable aléatoire qui, à chaque pièce prélevée au hasard dans la production,
associe son diamètre, en millimètres. On admet que la variable aléatoire X suit la
loi normale de moyenne 61,5 mm et d’écart-type 0,4 mm.
Déterminer, dans ces conditions, la probabilité qu’une pièce, tirée au hasard,
ait un diamètre compris entre 60,7 mm et 62,3 mm.
Une pièce est déclarée défectueuse si son diamètre est soit inférieur à
60,7 mm, soit supérieur à 62, 3 mm. Calculer la probabilité qu’une pièce tirée
au hasard soit défectueuse.
Sachant qu’une pièce n’est pas défectueuse, quelle est la probabilité que son
diamètre soit inférieur à 61 mm ?
Exercice 6 La production laitière annuelle en litres des vaches laitières de la race « Française
Frisonne Pie Noir » peut être modélisée par une variable aléatoire suivant la loi
normale de moyenne µ = 6000 et d’écart-type σ = 400.
Calculer la probabilité qu’une vache de cette race produise entre 5 800 et
6 200 litres par an.
Calculer la probabilité qu’une vache de cette race produise moins de
5 700 litres par an.
Calculer la probabilité qu’une vache de cette race produise plus de 6 300 litres
par an.
Donner une interprétation concrète du nombre x tel que P ( X < x ) = 0, 30.
Déterminer x.
Calculer la production minimale prévisible des 20 % de vaches les plus pro-
ductives du troupeau.
24 Séquence 9 – MA02
Séquence 9 – MA02 25
A Objectifs du chapitre
Quand on réalise une expérience aléatoire, on observe bien sûr que les résultats
obtenus ne sont pas toujours les mêmes, c’est la fluctuation d’échantillonnage.
Mais on observe aussi que, quand on répète une expérience un grand nombre de
fois, il y a une régularité des résultats.
Le théorème de Moivre-Laplace permet de mathématiser ces observations.
On définit des intervalles de fluctuation.
On pourra alors décider si on considère que des résultats obtenus lors d’une
expérience sont dus au hasard (c’est-à-dire à la fluctuation d’échantillonnage),
ou si on considère qu’ils sont statistiquement significatifs d’une différence avec
le modèle choisi.
B Pour débuter
Activité 4 Rappel
En statistiques, un échantillon de taille n est la liste des n résultats obtenus par
n répétitions indépendantes de la même expérience aléatoire. Ici l’expérience
répétée est une épreuve de Bernoulli, c’est-à-dire qu’elle ne prend que deux
valeurs : échec / réussite, oui / non, homme / femme, 0 / 1…
Par exemple, un échantillon de taille 100 du lancer d’une pièce où on compte le
nombre de fois où on obtient « pile » est la liste des résultats obtenus en lançant
effectivement 100 fois la pièce.
Le nombre de réussites dans un échantillon de taille n suit la loi binomiale
B(n ; p ).
Définition 5
26 Séquence 9 – MA02
Séquence 9 – MA02 27
p (1− p ) p (1− p )
p − 1, 96 ; p + 1, 96 .
n n
Premier cas
0,35
0,3
0,25
fréquence
0,2
0,15
0,1
0,05
0
0 20 40 60 80 100
28 Séquence 9 – MA02
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
0 20 40 60 80 100
Troisième cas
0,3
0,25
0,2
0,15
0,1
0,05
0
0 20 40 60 80 100
Séquence 9 – MA02 29
Propriété 7
X
La variable aléatoire Fn = n :
n
1 2 n
t prend n + 1 valeurs : 0, , ,..., ;
n n n
X X p (1− p )
t vérifie E n = p et σ n = .
n n n
Démonstration
La variable aléatoire X n prenant les n + 1 valeurs : 0, 1, 2, …, n, on en déduit
celles de Fn .
On sait que E ( X n ) = np et σ ( X n ) = np (1− p ), on sait aussi que
E(aX + b ) = aE( X ) + b et σ (aX + b ) = a σ ( X ), donc on divise l’espérance et
l’écart-type par n et on obtient les valeurs annoncées.
Les fréquences Fn ont pour espérance p qui ne dépend pas de n.
p (1− p )
Les fréquences Fn ont pour écart-type qui diminue quand n augmente.
n
Les résultats observés ont tendance à se resserrer autour de l’espérance p quand
n augmente. C’est cette concentration des valeurs les plus probables autour de p
qui permet d’améliorer la prise de décision à partir des observations.
Définition 6
X
Un intervalle de fluctuation asymptotique de la variable aléatoire Fn = n
n
au seuil 1− α est un intervalle déterminé à partir de p et de n et qui contient
Fn avec une probabilité d’autant plus proche de 1− α que n est grand.
30 Séquence 9 – MA02
Théorème 3
Soit p un nombre réel fixé de l’intervalle ]0 ; 1[ .
Soit une suite de variables aléatoires ( X n ) chaque variable aléatoire X n
suivant la loi binomiale B(n ; p ), alors, pour tout réel α dans ]0 ; 1[ , on a
X
lim P n ∈ In = 1− α , où In est l’intervalle
n →+∞ n
p (1− p ) p (1− p )
p − u α ; p + uα .
n n
Démonstration
La variable aléatoire X n suit la loi binomiale B(n ; p ), donc E ( X n ) = np et
σ ( X n ) = np (1− p ).
X − np
La variable aléatoire Z n définie par Z n = n est la variable centrée et
réduite associée à X . np (1− p )
n
D’après le théorème de Moivre-Laplace, pour tous réels a et b tels que a < b ,
on a : x2
b 1 −
lim P (a ≤ Z n ≤ b ) = ∫ e 2 dx .
n →+∞ a 2π
Or :
X − np
P (a ≤ Z n ≤ b ) = P a ≤ n ≤ b
np (1− p )
(
= P a np (1− p ) ≤ X n − np ≤ b np (1− p ) )
= P (np + a np (1− p ) ≤ X n ≤ np + b np (1− p ) )
a p (1− p ) X b p (1− p )
= P p + ≤ n ≤p+ .
n n n x2
a p (1− p ) X b p (1− p ) b 1 −
Donc lim P p + ≤ n ≤p+ = ∫ e 2 dx .
n →+∞ n n n a 2π
En remplaçant a et b par −u α et u α on obtient :
2
x
u p (1− p ) X u α p (1− p ) uα 1 − 2
lim P p − α ≤ n ≤p+ = ∫ e dx = 1− α ,
n →+∞ n n n −u α 2π
c’est-à-dire :
X
lim P n ∈ In = 1− α.
n →+∞ n
Séquence 9 – MA02 31
Démonstration
C’est une conséquence immédiate du théorème précédent car la suite
X X
P n ∈ In converge vers 1− α. L’intervalle In contient bien Fn = n avec
n n
une probabilité d’autant plus proche de 1− α que n est grand.
p (1− p ) p (1− p )
À savoir L’intervalle Jn = p − 1,96 ; p + 1,96 est un intervalle de
n n
fluctuation asymptotique au seuil de 95 % (p désigne la proportion dans la
population).
En effet, pour α = 0,05 , on sait que u 0,05 ≈ 1, 96.
Remarque Les intervalles In et Jn sont des intervalles de fluctuation asymptotiques car il y
a la condition « d’autant plus proche de … que n est grand ». On peut considérer
que In et Jn sont des intervalles de fluctuation « approchés », la probabilité
que Fn appartienne à In ou à Jn n’est pas forcément supérieure à 0,95 mais si
elle n’est pas supérieure à cette valeur, elle en est proche.
En pratique dans les exercices, la taille n de l’échantillon est fixée, l’intervalle de
fluctuation asymptotique Jn correspondant sera l’intervalle de fluctuation utilisé.
Remarque Conditions d’utilisation
Les exigences habituelles de précision pour utiliser cette approximation sont :
n ≥ 30, np ≥ 5 et n (1− p ) ≥ 5.
Remarque Dans l’activité 5, on a pu faire des observations cohérentes avec ces résultats.
Mais la définition d’un intervalle de fluctuation est exprimée avec une probabi-
lité. Si vous faites d’autres simulations avec le fichier qui est sur le site, il se peut
que quelques observations donnent des pourcentages éventuellement un peu
éloignés de 95 %.
왘 Exemple 2 Déterminer un intervalle de fluctuation asymptotique au seuil de 95 % lorsque
n = 100 et p = 0, 5.
32 Séquence 9 – MA02
Remarque Avec cette règle, la fluctuation d’échantillonnage amène à rejeter, à tort, les 5 %
(environ) d’échantillons qui suivent le modèle de Bernoulli et qui ne sont pas
dans In .
Dans les exemples, les tirages sont effectués sans remise. La taille des échan-
tillons considérés étant faible par rapport à la taille de la population totale, on
assimile les tirages réalisés à des tirages avec remise et on peut alors appliquer
les résultats précédents.
왘 Exemple 3 (D’après document ressources de l’Éducation nationale)
Le responsable de la maintenance des machines à sous d’un casino doit vérifier
qu’un certain type de machine est bien réglé sur une fréquence de succès de 0,06.
Il décide de régler chaque machine pour laquelle il aura observé, dans l’historique
des jeux, une fréquence de succès se situant en dehors d’un intervalle de fluctua-
tion au seuil de 95 %.
Lors du contrôle d’une machine, le technicien constate qu’elle a fourni 9 succès
sur 85 jeux.
Séquence 9 – MA02 33
왘 Solution On a f = 9 ≈ 0,106.
85
On a n = 85, p = 0, 06, np = 5,1 et n (1− p ) = 79, 9, donc les conditions sont
remplies pour utiliser l’intervalle de fluctuation asymptotique du cours
0, 06 × 0, 94 0, 06 × 0, 94
0, 06 − 1, 96 ; p + 1, 96 .
85 85
Comme 0,009 est une valeur approchée par défaut de
0, 06 × 0, 94
0, 06 − 1, 96 et 0,111 est une valeur approchée par
85
0, 06 × 0, 94
excès de 0, 06 + 1, 96 , alors [ 0, 009 ; 0,111] contient
85
0, 06 × 0, 94 0, 06 × 0, 94
0, 06 − 1, 96 ; p + 1, 96 et [ 0, 009 ; 0,111] est
85 85
donc un intervalle de fluctuation légèrement plus large que celui du cours.
La fréquence observée f se situe dans l’intervalle de fluctuation, donc le
réglage de la machine n’est pas modifié.
21
Dans ce deuxième cas, la fréquence observée est f = = 0,105 et l’in-
200
tervalle de fluctuation est environ égal à [ 0, 027 ; 0, 093]. La fréquence f du
nombre de succès observée n’est pas dans l’intervalle car elle est trop grande,
donc le technicien va modifier le réglage de la machine. On remarque que,
dans les deux cas, les fréquences f sont presque les mêmes mais les décisions
prises sont différentes car les intervalles de fluctuation sont différents.
Remarque L’amplitude de l’intervalle de fluctuation asymptotique au seuil de 95 % du cours
p (1− p )
est égale à 2 × 1, 96 . Pour une valeur de p donnée, cette amplitude
n
diminue quand la taille n de l’échantillon augmente.
1 1
3. Complément sur les intervalles p − ;p+
n n
a) On peut retrouver l’intervalle de fluctuation qui a été
donné en classe de Seconde.
1
Pour tout p dans ]0 ; 1[ , l’inégalité p (1− p ) ≤
est vérifiée (la fonction polynôme
2
4
du second degré p p (1− p ) = − p + p admet un maximum car le coefficient de
1 1 1 1
p 2 est négatif, ce maximum est atteint pour p = et il vaut donc 1− = ).
2 2 2 4
34 Séquence 9 – MA02
Théorème 4
Démonstration
La démonstration est proposée ci-dessous en exercice résolu. Elle fait intervenir
le théorème de Moivre-Laplace, la définition d’une suite convergente, la majora-
tion de p (1− p ) vue ci-dessus.
Exercice résolu Démontrer que
p (1− p ) X n p (1− p ) 1 Xn 1
Pp −2 ≤ ≤ p +2 ≤P p − ≤ ≤p+ .
n n n n n n
p (1− p ) X n p (1− p )
On pose an = P p − 2 ≤ ≤ p +2
. Démontrer que
n n n
X − np
an = P −2 ≤ n ≤ 2 et en déduire que la suite (an ) est convergente
np (1− p )
vers une limite L telle que 0, 95 < L < 0, 96.
Séquence 9 – MA02 35
X 1 1
P n ∈ p − ;p+ ≥ 0, 95.
n n n
36 Séquence 9 – MA02
Séquence 9 – MA02 37
B Pour débuter
Dans ce chapitre, vous apprendrez à répondre à des questions analogues à la
suivante.
On considère une urne contenant un très grand nombre de petites billes de cou-
leur blanche ou noire, la proportion p de billes noires est inconnue. On cherche à
estimer p à partir d’un échantillon de taille n.
On effectue 100 tirages indépendants et on obtient 71 billes noires et 29 billes
blanches, à combien peut-on estimer p ?
Même question sachant qu’on a effectué 1000 tirages et obtenu 693 billes
noires et 307 billes blanches.
38 Séquence 9 – MA02
2. Exemple de référence
Avant d’aborder les définitions et les propriétés bien mises en forme mais un peu
difficiles au premier abord, nous allons étudier un exemple.
On considère une urne contenant un très grand nombre de petites billes de cou-
leur blanche ou noire, la proportion p de billes noires est inconnue. On cherche à
estimer p à partir d’un échantillon de taille n.
La probabilité d’obtenir une bille noire quand on fait un tirage au hasard est
égale à la proportion p.
On sait donc que, parmi tous les échantillons de taille n qu’on peut obtenir, envi-
ron 95 % d’entre eux ont une fréquence f qui appartient à l’intervalle de fluctua-
tion p −
1 1
;p+ . Le résultat préliminaire du prouve que :
n n
1 1 1 1
p− ≤f ≤ p + ⇔f − ≤ p ≤f + ,
n n n n
1 1 ′′
ce qui permet de déduire que : f ∈ p − ;p+ est équivalent à
1 1 ′′ n n
p ∈ f − ;f + .
n n
Donc, parmi tous les échantillons de taille n qu’on peut obtenir, environ 95 %
sont tels que l’intervalle associé f −
1 1
;f + contient le nombre p que
l’on cherche à estimer. n n
On réalise donc un échantillon de taille n en effectuant n tirages indépendants
(tirages au hasard avec remise). On calcule la fréquence f de billes noires dans
1 1
l’échantillon obtenu et on détermine l’intervalle f − ;f + .
n n
On dit alors que p appartient à f −
1 1
;f + avec un niveau de confiance
n n
de 95 % et que l’intervalle f −
1 1
;f + est un intervalle de confiance au
niveau 95 %. n n
Séquence 9 – MA02 39
3. Définition
Comme dans le chapitre précédent, on considère une suite de variables aléatoires
( X n ) où chaque variable aléatoire X n suit la loi binomiale B(n ; p ) (exemple :
on lance n fois une pièce et X n est le nombre de « pile » obtenus). La variable
X
aléatoire Fn = n donne donc la fréquence du nombre de « succès ».
n
On dit qu’un intervalle est aléatoire lorsque ses bornes sont définies par des
variables aléatoires.
La réalisation d’un intervalle aléatoire est l’intervalle obtenu après avoir réalisé
l’expérience aléatoire (après avoir lancé 500 fois une pièce, interrogé 1000 per-
sonnes…).
40 Séquence 9 – MA02
Propriété 9
Démonstration
Dans le chapitre précédent, on a démontré le théorème 4. On sait donc que, pour
une valeur de p fixée, il existe un entier n0 tel que : si n ≥ n0 alors
1 Xn 1
Pp − ≤ ≤p+ ≥ 0, 95.
n n n
1 Xn 1 1 1
Comme P p − ≤ ≤p+ = P Fn − ≤ p ≤ Fn + , l’intervalle
n n n n n
aléatoire Fn −
1 1
; Fn + contient bien pour n ≥ n0 la proportion p avec
n n
une probabilité au moins égale à 0,95.
À savoir
On se place dans le cas où l’échantillon contient au moins 30 éléments. Si
la fréquence f observée est telle que nf ≥ 5 et n (1− f ) ≥ 5, on convient
que f est une estimation de p et que l’intervalle f −
1 1
;f + est
n n
un intervalle de confiance au niveau de 95 % pour la proportion p.
Cet intervalle est parfois appelé fourchette de sondage.
Séquence 9 – MA02 41
Les sondages sont souvent faits avec des échantillons d’environ 1000 personnes,
la précision obtenue est donc d’environ 0,06.
Ainsi, questionner 1 112 personnes suffit pour avoir une fourchette de sondage
d’amplitude 0,06, qu’il s’agisse d’un sondage pour un référendum local concer-
nant 100 000 électeurs ou pour le deuxième tour d’une élection présidentielle
concernant 35 millions d’électeurs.
Il faut bien sûr savoir cela quand on reçoit des informations où les sondages sont
un élément important.
42 Séquence 9 – MA02
6. Simulation
Pour mieux voir ce qu’est un intervalle de confiance, une fourchette de sondage,
on a réalisé 20 séries de 200 tirages de 0 et de 1 au hasard.
Pour chaque série, on obtient un intervalle de confiance.
Dans la colonne GS, on a déterminé la fréquence avec laquelle on a obtenu 1.
Dans les colonnes GT et GU sont calculées les bornes de l’intervalle de confiance
du cours au niveau de 95 %. La sélection des colonnes GT et GU et le choix
de « XY dispersion » dans type de diagramme dans Open Office donne le dia-
gramme ci-dessous.
Les 20 intervalles de confiance sont limités verticalement par les deux séries de
points.
On constate ici que 19 d’entre eux contiennent p = 0, 5 qui est la proportion
réelle dans cet exemple de tirage au hasard. Un seul intervalle ne contient pas
p = 0, 5.
Dans d’autres simulations, on peut bien sûr trouver plusieurs intervalles de
confiance, plusieurs fourchettes de sondage, qui ne contiennent pas p ; on peut
aussi n’en trouver aucun.
Quand on veut estimer une proportion, on utilise un seul intervalle de confiance.
La simulation permet de voir qu’environ 95 % des intervalles de confiance
contiennent p ce qui illustre la propriété 8.
Séquence 9 – MA02 43
D Exercices d’apprentissage
Exercice 11 Une usine vient d’installer une chaîne de fabrication pour fabriquer une nou-
velle pièce. Après un bref temps de fonctionnement, on prélève 100 pièces.
La fabrication est assez importante pour que ce prélèvement soit assimilé
à un tirage avec remise. On trouve 23 pièces défectueuses. Déterminer un
intervalle de confiance de la proportion de pièces sans défaut avec un niveau
de confiance de 95 %.
Des modifications ont été apportées. On prélève de nouveau 100 pièces et on
en trouve 9 défectueuses.
Déterminer l’intervalle de confiance correspondant.
Conclure.
Exercice 12 Dans une grande ville, un nouveau cinéma va être construit. La municipalité pro-
pose un terrain à proximité du centre ancien.
Un premier sondage est effectué auprès de 100 personnes choisies de façon
aléatoire et indique 53 avis favorables. Peut-on dire que la majorité de la
population est favorable à cet emplacement ?
Un deuxième sondage effectué auprès de 500 personnes indique la même
proportion d’avis favorables. La conclusion est-elle différente ?
Si un sondage effectué auprès de n personnes indique la même proportion
d’avis favorables, à partir de quelle valeur de n peut-on estimer, au niveau
de confiance de 95 %, que la majorité de la population est favorable à cet
emplacement ?
44 Séquence 9 – MA02
Centrer et réduire
Définition
On dit qu’une variable aléatoire est centrée et réduite lorsque son espérance
est nulle et son écart-type égal à 1.
Propriété
Séquence 9 – MA02 45
n = 99
0,5
p = 0,34
0,4
0,3
0,2
0,1
0
–4 –3 –2 –1 0 1 2 3 4
Définition
Une variable aléatoire X suit la loi normale centrée réduite N (0 ;1) si, pour
tous réels a et b tels que a < b , on a :
x2
b b 1 −
P (a ≤ X ≤ b ) = ∫a f ( x ) dx = ∫a 2π
e 2 dx .
1/ 2/ 0,4
O 1
46 Séquence 9 – MA02
Définition
ᏺ (3;0,25)
ᏺ (1;1)
ᏺ (0;1)
ᏺ (0;4) ᏺ (1;4)
O 1
t Espérance et écart-type
Si une variable aléatoire X suit la loi normale N (µ ; σ 2 ) alors E( X ) = µ et σ ( X ) = σ .
t Calculs
La variable aléatoire X suivant la loi normale N (µ ; σ 2 ), il faut savoir calculer des probabilités de
la forme : P (a ≤ X ≤ b ), P ( X ≤ c ) et P ( X ≥ c ), a, b et c étant des nombres réels donnés.
Il faut aussi savoir déterminer le nombre x tel que P ( X ≤ x ) = p , p étant une probabilité donnée.
Séquence 9 – MA02 47
0,68
µ
µ– µ+
µ–2 µ+2
µ–3 µ+3
Intervalles de fluctuation
Définition
X
Un intervalle de fluctuation asymptotique de la variable aléatoire Fn = n
n
au seuil 1− α est un intervalle déterminé à partir de p et de n et qui contient
Fn avec une probabilité d’autant plus proche de 1− α que n est grand.
Théorème
48 Séquence 9 – MA02
Conditions d’utilisation
Les exigences habituelles de précision pour utiliser cette approximation sont :
n ≥ 30, np ≥ 5 et n (1− p ) ≥ 5.
t Il faut savoir utiliser un intervalle de fluctuation pour prendre une décision.
La règle de décision adoptée étant la suivante :
si la fréquence observée f dans un échantillon appartient à un intervalle
{
Intervalle de confiance
Définitions
Conditions d’utilisation
On se place dans le cas où l’échantillon contient au moins 30 éléments et où
la fréquence f observée est telle que nf ≥ 5 et n (1− f ) ≥ 5.
t La précision de l’estimation est donnée par l’amplitude de l’intervalle
1 1 2
f − ; f + qui est égale à et dépend donc de la taille n de
n n n
l’échantillon.
Séquence 9 – MA02 49
50 Séquence 9 – MA02
Séquence 9 – MA02 51