Professional Documents
Culture Documents
Module 7 : Echantillonnage
Introduction
Les échantillons sont utilisés dans tous les domaines. Par exemple, lorsqu’on
fait un examen du sang afin de contrôler l’état de notre santé, on prélève un
échantillon de sang pour examen dans un laboratoire, au lieu d’examiner tout
le sang. Des tests sont menés sur l’échantillon prélevé et en principe, ce
qu’on trouve dans l’échantillon est un reflet exact de l’état de tout le sang.
Des échantillons prélevés au hasard sont des échantillons dont chaque unité
de la population a des chances égales d’être sélectionnée. On pourra prélever
au hasard un échantillon de documents, de routes, de champs ou de
personnes. Un des avantages de l’échantillonnage est que cela permet
d’éliminer le risque de subjectivité dans la sélection. Puisque tout le monde a
une chance égale d’être sélectionnée, il est impossible de sélectionner ceux
1
Traduit par le Réseau nigérien de Suivi Evaluation (ReNSE), http://www.pnud.ne/rense, Mai 2003
1
Des nombres peuvent être générés au hasard sans beaucoup de difficulté à l’aide d’un des principaux logiciels tableur.
Pour générer un nombre entier au hasard entre 1 et 100 à l’aide du logiciel Microsoft Excel, par exemple, il faut saisir
la formule =RAND ()*100 et formater la cellule comme un nombre ayant zéro décimaux, puis copier à autant de
cellules qu’il faut des nombres prélevés au hasard (c'est-à-dire, la taille d’échantillon voulu). Pour générer des nombres
au hasard entre 100 et 200, il faut simplement ajouter 100 à la formule, c'est-à-dire, =RAND*100+100.
Un tableau généré par Excel de nombres composés de deux chiffres prélevés au hasard (la forme des nombres d’un
tableau standard) se trouve en Exercice 7-1 à la fin de ce module.
2
Traduit par le Réseau nigérien de Suivi Evaluation (ReNSE), http://www.pnud.ne/rense, Mai 2003
Echantillon groupé
L’échantillon groupé est une méthode composée d’une multiplicité d’étapes
pour collecter des données dans des situations où il n’existe pas de liste
complète de tout le monde dans la population d’intérêt. Par exemple, on ne
dispose pas d’une seule liste complète de tous les patients atteints du SIDA
dans le pays mais peut-être on pourra obtenir une liste de toutes les
cliniques de soins du SIDA. A partir de ces cliniques, on pourra prélever au
hasard un échantillon de cliniques de soins du SIDA et ensuite prélever au
hasard un échantillon de patients dans chacune des cliniques.
Conjugaison
Parfois il faudra conjuguer des méthodes. On pourra répartir le groupe en
strates ; on pourra sélectionner tous ceux qui se trouvent dans une strate et
on pourra prélevé au hasard un échantillon des cas dans les autres strates.
Le programme au Ghana (voir l’étude de cas 7-1) est un exemple de la
complexité potentielle des techniques d’échantillonnage conjuguées.
3
Traduit par le Réseau nigérien de Suivi Evaluation (ReNSE), http://www.pnud.ne/rense, Mai 2003
4
Traduit par le Réseau nigérien de Suivi Evaluation (ReNSE), http://www.pnud.ne/rense, Mai 2003
Lorsqu’il s’agit d’un échantillon qui n’a pas été prélevé au hasard, la question
de subjectivité devient très importante. Y a-t-il une caractéristique de cet
échantillon en particulier qui distingue l’échantillon de la population globale ?
Disons qu’on voudrait collecter des renseignements démographiques afin de
pouvoir décrire les caractéristiques de l’échantillon. Idéalement, il n’y aura
pas de différences évidentes entre l’échantillon et la population globale.
Lorsqu’on présente les caractéristiques démographiques de l’échantillon, cela
permet aux personnes intéressées par cette étude de juger le niveau de
similitude entre l’échantillon et la population globale.
5
Traduit par le Réseau nigérien de Suivi Evaluation (ReNSE), http://www.pnud.ne/rense, Mai 2003
Dans le cas des échantillons qui n’ont pas été prélevés au hasard, il faudra
présenter les résultats en termes des participants. Par exemple, « de toutes
les mères ayant participé aux entretiens, 70% sont satisfaites de la qualité
des soins de santé dispensés à leurs enfants ». Si l’échantillonnage n’est pas
au hasard, il faudra être très prudent en faisant des inférences
(généralisations) sur la population en général. Cependant, les données
disponibles pourront être très utiles et il se peut qu’elles soient les meilleures
données possibles dans la situation. Il est essentiel d’expliquer clairement les
critères et les procédures de sélection de l’échantillon.
2
Une discussion sur les formules statistiques ne sera pas présentée ici.
6
Traduit par le Réseau nigérien de Suivi Evaluation (ReNSE), http://www.pnud.ne/rense, Mai 2003
Lorsqu’on travaille avec des nombres réels, tels que l’âge ou le revenu, la
précision est présentée en termes d’un intervalle de confiance. (A noter : il
ne faudra pas confondre l’intervalle de confiance avec le concept de niveau
de confiance expliqué ci-dessus). Ce concept est utilisé lorsqu’il faudra
estimer la moyenne de la population entière sur la base des rés ultats de
l’échantillon. Par exemple, si le revenu moyen per capita des pauvres en
milieu rural de l’échantillon s’élève à 2 000 Rands sud Africains par an,
l’ordinateur va calculer l’intervalle de confiance. Le niveau normal est de
95%. L’ordinateur calcule que le niveau de confiance se trouve entre R 1 800
et R 2 000. On pourra dire qu’on est 95% certain (c’est le niveau de
confiance) que le salaire moyen réel de la population est entre 1 800 et
2 200 (c’est le niveau de confiance).
Ces tailles d’échantillon sont des tailles minimales. Il faudra sélectionner une
taille d’échantillon un peu plus importante s’il y a une possibilité que le taux
de réponse n’est pas près de 100%. Par exemple, si les questionnaires
d’enquête sont envoyés par la poste, il faudra augmenter la taille de
l’échantillon par un multiple d’au moins 4 ou 5 afin de tenir compte du
pourcentage de participants qui probablement ne répondra pas. S’il faudra
comparer des strates, il faudra sélectionner une taille d’échantillon pour
chaque strate sur la base de la taille de la population et le degré de confiance
et de précision nécessaires. Il y a des circonstances (par exemple, lors des
appréciations rapides) où un degré très élevé de précision n’est pas
nécessaire et moins de cas sont donc nécessaires.
7
Traduit par le Réseau nigérien de Suivi Evaluation (ReNSE), http://www.pnud.ne/rense, Mai 2003
Table 7-1
Guide pour la taille minimum d’échantillon correspondant à la taille
de la population3
3
Ce sont des tailles d’échantillon du niveau de confiance de 95% et d’une erreur d’échantillonnage de +/-5%
8
Traduit par le Réseau nigérien de Suivi Evaluation (ReNSE), http://www.pnud.ne/rense, Mai 2003
Instructions :
Stratégie 1 :
Conditions :
Stratégie 2 :
Conditions :
Stratégie 3 :
Conditions :
Finalement, faire une liste des cas sélectionnés à l’aide de la stratégie la plus
simple de sélection au hasard :
_____ _____ _____ _____ _____ _____ _____ _____ _____ _____
_____ _____ _____ _____ _____ _____ _____ _____ _____ _____
9
Traduit par le Réseau nigérien de Suivi Evaluation (ReNSE), http://www.pnud.ne/rense, Mai 2003
10
Traduit par le Réseau nigérien de Suivi Evaluation (ReNSE), http://www.pnud.ne/rense, Mai 2003
Mesure :
Mesure :
11
Traduit par le Réseau nigérien de Suivi Evaluation (ReNSE), http://www.pnud.ne/rense, Mai 2003
Echantillon prélevé
au hasard : Un échantillon dont chaque unité
de la population a des chances égales d’être
sélectionnée
Echantillon progressif
ou « boule de neige » : Une stratégie d’échantillonnage
normalement appliquée aux entretiens, où
on demande à la personne de suggérer
d’autres personnes.
12
Traduit par le Réseau nigérien de Suivi Evaluation (ReNSE), http://www.pnud.ne/rense, Mai 2003
13