CHAPITRE 1 TECHNIQUES DCHANTILLONNAGE H Objectif Ltudiant doit
CHAPITRE 1 : TECHNIQUES D’ÉCHANTILLONNAGE H
Objectif: L’étudiant doit être capable d’appliquer le principe de sélection d’un échantillon à l’aide d’une méthode aléatoire ou d’une méthode non aléatoire.
Introduction population: ensemble des éléments sur les quels porte l’étude statistique. Enquête complète ( exhaustive) Recensement paramètre de la population: ( m, σ, ²σ, p)
Introduction Pour multiples raisons: cout, faible taux de réponse, manque de personnel, impossibilité… Echantillon: petit groupe représentatif extrait d’un grand groupe que l’on nomme « population »
Introduction population échantillon Echantillonnage -enquête partielle -sondage -caractéristiques de l’échantillon ( x, S; S², f)
Introduction L’échantillonnage est le processus par lequel on détermine l’échantillon Son but suprême est l’atteinte d’une représentativité impartiale de la population à l’étude pour que toute estimation basée sur l’échantillon soit sans biais et inférée à la population La procédure d’échantillonnage doit permettre la constitution d’un sous-groupe recouvrant les caractéristiques qui peuvent influencer la valeur des paramètres que l’on veut estimer
Introduction L’échantillon doit être représentatif pour cela il faut connaitre: Ø Ø Ø Comment sélectionner un échantillon? (Méthodes d’échantillonnages) Combien d’élément on va prendre dans cet échantillon? (taille de l’échantillon) Est-ce que si suffisant pour estimer les paramètre de la population? (distribution d’échantillonnage)
Les Méthodes d’échantillonnages Echantillonner: c’est choisir une partie d’une population pour représenter l’ensemble de la population. On a donc recours à des techniques bien précises pour construire un échantillon et s’assurer qu’il est représentatif de sa population mère. Il existe deux grandes catégories de méthodes: Ø Les méthodes d’échantillonnage non probabilistes (ou empiriques) Ø Les méthodes d’échantillonnage probabilistes (ou aléatoires).
Les Méthodes d’échantillonnages Est-ce que il y’a un critère de choix entre les deux grandes méthodes ? Oui, et c’est ce qu’on appelle « la base du sondage »
Les Méthodes d’échantillonnages La base du sondage : est une liste ou il y’a les informations sur tout les éléments de la population pour qu’on puisse localiser les individus à interroger. Exemple : liste d’amis sur FACEBOOK, liste d’abonnée de MOBILIS , liste des étudiants….
Les Méthodes d’échantillonnages v Si on a une base de sondage on utilise les méthodes probabilistes. Si on n’a pas une base de sondage on utilise les méthodes non probabilistes (méthode des quotas). v
Les méthodes non probabilistes Les méthodes d’échantillonnage empiriques Elles regroupent les techniques où les éléments de l’échantillon sont choisis sur le terrain en fonction de jugements sur les caractéristiques de la population ou bien en reconstituant le hasard. Elles ne nécessitent pas de base de sondage, elles sont rapides, et pas très chères.
Les méthodes non probabilistes Les échantillons obtenus à l’aide de ces méthodes sont les suivants : Ø Ø Ø les échantillons par quotas ou proportionnel les échantillons « accidentels » ou à l’aveuglette les échantillons de volontaires
Echantillonnage par quotas Dans cette méthode on prend un échantillon de façon a avoir une image fidèle sur l’ensemble de la population c’est à dire qu’on doit respecter les pourcentages (quotas) de ce qu’on appelle La variable de contrôle.
Echantillonnage par quotas Mots clés : La variable de contrôle : permet d’assurer la conformité de l’échantillon. exemple : âge, sexe ; revenu…… le taux de sondage : n/N
Echantillonnage par quotas Exemple d’application : si on a dans une population 48% d’hommes et 52% femmes , 25% de jeunes de 25 à 30 ans ; l’enquêteur auprès de 100 personnes donc il devra interroger 48 homme (n X quotas de la population) et 52 femme et 25 personne de 25à 30.
Echantillonnage par quotas Les quotas retenus peuvent être « Simples » c'est-à-dire avec plusieurs séries de distribution qui seront répétées de façons indépendantes ou encor « croisée » en combinant plusieurs caractéristiques.
Echantillonnage par quotas Revenons à notre exemple si l’on sait que 19% des femmes de la population mère ont entre 25à 30 ans et 31% des hommes ont de 25 à 30 ans. L’enquêteur devra respecter ces quotas et interroger 10 femmes et 15 hommes ayant de 25à 30 ans 19%+31%=50% (19 X 50)/100=10 ; (31 X 50)/100=15
Echantillonnage « accidentels » ou à l’aveuglette La personne qui déguste des échantillons de nouveaux produits pour déterminer lequel est le meilleur ou le journaliste qui, au moyen d'entrevues dans la rue, sonde L'opinion du grand public sur un sujet d'actualité, mettent en pratique la méthode de L'échantillonnage à l'aveuglette.
Echantillonnage « accidentels » ou à l’aveuglette Le grand avantage de cette méthode est qu'elle demande peu de planification. D'application restreinte, elle peut malgré tout donner de bons résultats si la population observée est homogène. Par exemple, si L'on désire évaluer la concentration d'un produit chimique dans un lac ou le taux de glycémie d'une personne, il est raisonnable de supposer que les résultats devraient être assez semblables d'un échantillon à L'autre.
Echantillonnage volontaires Dans le cas d'expériences psychologiques ou médicales, d'enquêtes sur les habitudes de consommation, il ne serait pas pratique de choisir au hasard des individus dans toute la population. Comme l'enquête sera longue, exigeante, quelquefois même désagréable, on préfère réunir des volontaires, d'où le nom d'échantillonnage de volontaires. Néanmoins, il faut toujours craindre un écart entre les caractéristiques des volontaires et celles de la population.
Les méthodes d’échantillonnage probabiliste : Elles regroupent les techniques qui font intervenir le hasard pour désigner les éléments de l’échantillon. Elles nécessitent une base de sondage (liste de tous les individus de la population mère), sont plus coûteuses et longues que les méthodes empiriques.
Les méthodes d’échantillonnage probabiliste : Les échantillons obtenus par ces techniques sont : les échantillons aléatoires simples échantillons systématiques les échantillons par grappe les échantillons stratifiés
Echantillonnage aléatoire simple Un échantillon aléatoire simple est un échantillon sélectionnée de manière à ce que chaque échantillon possible de taille "n" ait la même probabilité d’être sélectionné, On prélève dans la population des individus au hasard, tous les individus ont la même probabilité d’être prélevés, et ils le sont indépendamment les uns des autres
Echantillonnage aléatoire simple pour prévlever un echantillon aléatoire simple il faut : 1) constriure une base de sondage 2) Numéroter les éléments de la population de 1àN 3) Procéder a la selection des éléments pour constituer l’échantillon a l’aide « la table des nombre aléatoires »
Echantillonnage aléatoire simple on utilise la table des nombres aléatoires en suivant 3 étapes : 1. on choisit aléatoirement un nombre (dans la table) compris entre 1 et N (points d’entré) 2. on choisit notre chemin de lecture : haut ; bas ; gauche ; droite 3. on suit notre chemin en choisissant seulement les nombre compris entre 1 et N
Echantillonnage aléatoire simple -le tirage de jetons numérotés ou de papier avec le nom de chaque individu - la désignation de façon aléatoire de l’échantillon à l’aide d’un ordinateur - la sélection de nombre identifiant les individus à l’aide d’une table de nombre aléatoire
Echantillonnage aléatoire simple Comment utiliser la table des nombre aléatoire ? Cette table est composée de 2000 nombre compris entre 0 et 9. par commodité de lecture ces nombres y figurent par groupe de 5 chiffres répartis sur 10 colonnes par bloc de 5 ligne
Echantillonnage aléatoire simple Exemple: On a une population de 850 individus(N=850) et on veut choisir un échantillon de taille 6(n=6) on a une base de sondage
Echantillonnage aléatoire simple On va choisir L 2 et C 2 le nombre : 55777 s’appelle point d’entré
Echantillonnage aléatoire simple 55777>850 on prend donc les 3 dernier chiffre(777) premier individu chemin de haut en bas à droite n={777, 7, 493, 572 , 547 , 475}
Echantillonnage aléatoire stratifié On suppose que la population soit stratifiée, constituée de sous-populations homogènes, les strates. (ex: stratification par tranche d’âge). Dans chaque strate, on fait un échantillonnage aléatoire simple, de taille proportionnelle à la taille de strate dans la population . Les individus de la population n’ont pas tous la même probabilité d’être tirés. Nécessite une homogénéité des strates. Le chercheur divise la population en sous -groupes distincts et homogènes (strates) à partir desquels il sélectionnera un échantillon aléatoire simple
Echantillonnage aléatoire stratifié Étapes : 1. choisir une variable de stratification (ex : tranche d’age). 2. Sélectionner un échantillon aléatoire dans chaque strate.
Echantillonnage aléatoire stratifié
Echantillonnage aléatoire stratifié Exemple On veut choisir par échantillonnage stratifié 10 élèves dans un groupe de 60, en tenant compte du fait que 50 % d'entre eux sont en première année, 30 % en deuxième année et 20 % en troisième année. Chaque année sera une strate dans laquelle on ira cher des élèves en tenant compte des pourcentages qu'occupe chaque strate dans la population. Ainsi, on choisira au hasard :
Echantillonnage aléatoire stratifié 5 élèves en 1ère année, puisque 10 x 50% = 5 3 élèves en 2ème année, puisque 10 x 30% = 3 2 élèves en 3ème année, puisque 10 x 20% = 2. Il ne reste plus qu'à sélectionner un échantillon dans chaque strate, ce qui pourrait être fait par échantillonnage aléatoire simple ou systématique.
L'échantillonnage systématique est une méthode demandant moins de manipulations que L'échantillonnage aléatoire simple. Cependant, elle suppose aussi l'existence d'une liste de la population où chaque individu est numéroté de 1 jusqu'à N. Notons n, le nombre d'individus que doit comporter L'échantillon. L'entier voisin de N/n sera noté r et appelé la raison de sondage (ou le pas de sondage)
L'échantillonnage systématique Choisissons ensuite au hasard un entier d entre 1 et N: cet entier sera le point de départ. Pour former L'échantillon, il s'agira de choisir un premier individu comme point de départ; ce sera l'individu dont le numéro correspond à d. Pour sélectionner les autres, il suffit d'ajouter à d la raison de sondage: les individus choisis seront alors les individus dont les numéros correspondent à: d ; d + r; d + 2 r; d + 3 r; …… ; d + (n-1)r. II faudra reprendre au début lorsque la liste sera épuisée.
L'échantillonnage systématique Exemple On veut choisir par échantillonnage systématique 6 étudiants parmi un groupe de 60. La raison de sondage (r) sera 10, car N/n = 10. (Si L'on devait trouver un échantillon de taille n = 7, la raison serait plutôt 9 puisque 60/7 = 8, 57, arrondi à 9. )
L'échantillonnage systématique Si L'origine choisie au hasard est disons, 3, les étudiants inclus dans L'échantillon correspondront aux numéros suivants: 3, c'est-à-dire le point de départ ; 13, c'est-à-dire 3 + 10 ; 23, c'est-à-dire 3 + (2 x 10) 33, c'est-à-dire 3 + (3 x 10) 43, c'est-à-dire 3 + (4 x 10) 53, c'est-à dire 3 + (5 x 10) Notre échantillon est maintenant complet ; il sera composé des étudiants portant les numéros suivants: 3, 13, 23, 33, 43, 53.
L'échantillonnage systématique Selon la raison de sondage et le point de départ choisi, il peut arriver que le nombre. . obtenu se situe à l'extérieur de la liste. En pareil cas, il faut revenir au début de la liste. Si L'on reprenait l'exemple précédent et si L'on devait continuer à prélever des étudiants, on obtiendrait le numéro 63, c'est-à-dire 3 + (6 x 10). Comme ce numéro r se situe à l'extérieur de la liste, on reviendrait au début de la liste et on choisirait le numéro 3 (puisque 63 - 60 = 3).
Les échantillons par grappe Dans chacune des méthodes précédentes, les unités de L'échantillon étaient choisies individuellement. L'échantillonnage par grappes consiste plutôt à choisir plusieurs individus en même temps, c'est-àdire par groupes. Par exemple, prenons comme population les habitants d'une ville à partir desquels on désire constituer un échantillon de 600 individus. Selon les méthodes précédentes, il faudrait choisir 600 individus disséminés dans toute la ville. Suivant L'échantillonnage par grappes, on pourra choisir les 600 individus dans une vingtaine d'immeubles choisis au hasard, où tous les occupants auront été retenus.
Les échantillons par grappe Exemple: Au moyen de L'échantillonnage par grappes, il s'agit de choisir 12 étudiants; dans un groupe de 60. On demande aux étudiants de se regrouper par 6. On choisit ensuite au hasard deux regroupements, par exemple les grappes numéro 4 et 7 en retenant tous les individus de ces deux grappes, on constitue un ; échantillon de 12 étudiants.
Les échantillons par grappe Dans l'exemple précédent, la situation était assez simple. En réalité, les choses sont beaucoup plus compliquées. Par exemple, dans une ville, les quartiers et les immeubles ne sont pas composés d'un nombre égal d'individus. Comment peut-on procéder alors pour effectuer un échantillonnage par grappes?
Les échantillons par grappe Puisque le nombre d'habitants et le nombre d'immeubles et de logements de chacun des quartiers sont généralement connus, il est possible de quadriller la ville en un grand nombre de secteurs (qu'on appelle îlots) ayant des populations à peu près semblables. Pour constituer un échantillon, il suffira alors de choisir certains de ces secteurs et, par conséquent, toutes les personnes qui y habitent
Distribution d’échantillonnage : La distribution d’échantillonnage est l’étude de la de probabilité de l’échantillon en fonction de la distribution de la variable parente lorsque la taille de l’échantillon augmente. Pour résoudre les problèmes d’estimation de paramètres inconnus, il faut tout d’abord étudier les distributions d’échantillonnage, c’est à dire la loi de probabilité suivie par l’estimateur.
Distribution d’échantillonnage : Considérons tous les échantillons possibles de taille n extraits d’une population de taille N, de moyenne µ, de variance σ ² , …etc. Pour chaque échantillon, il est possible de calculer les paramètres statistiques X ; s² …etc qui varient d’un échantillon à l’autre. Chaque paramètre possédera ainsi une distribution d’échantillonnage au même titre que la variable aléatoire X. On utilise souvent :
Distribution d’échantillonnage :
Distribution d’échantillonnage des moyennes Soit une population de taille N, on désigne par µ et σ la moyenne et l’écart-type de cette population respectivement. On extrait de la population une série d’échantillons de taille n, chacun de ces échantillons a une moyenne X, les différentes moyennes obtenues constituent une distribution d’échantillonnage de moyenne ¯X, on désigne par μ et σ la moyenne et l’écart type de la distribution d’échantillonnage de la moyenne.
Distribution d’échantillonnage des moyennes On a : Si le tirage est exhaustif (sans remise) : Dans le cas où la population est infinie ou le tirage est non exhaustif (avec remise) :
Distribution d’échantillonnage des moyennes Remarques : Si n est petit devant N, la distinction entre exhaustivité et non exhaustivité est sans objet car Si la taille des échantillons est assez grande (en pratique n ≥ 30), la distribution d’échantillonnage de la moyenne approche la distribution normale quelle que soit la distribution de la population. Si la population est normalement distribuée, la distribution d’échantillonnage de la moyenne est une loi normale quelle que soit la valeur n de la taille des échantillons.
Distribution d’échantillonnage des variances : Chaque échantillon de taille n de la population à une variance ces variances sont des valeurs observées d’une même variable aléatoire.
Distribution d’échantillonnage des fréquences : La probabilité de la réalisation d’un évènement est supposée être égale à p. on considère les échantillons de taille n extraits, avec remise, d’une population de taille N. a chaque échantillon extrait correspond une fréquence f de réalisation de l’évènement considéré.
Distribution d’échantillonnage des fréquences : On a : Si le tirage est avec remise : Si le tirage est sans remise
Synthèse
Synthèse
- Slides: 56