STATISTIQUE INFERENTIELLE L ESTIMATION UN EXEMPLE Montant quotidien
- Slides: 25
STATISTIQUE INFERENTIELLE L ’ESTIMATION
UN EXEMPLE Montant quotidien des dépôts en liquide dans la banque Ibardinescroak de Saint Jean de Luz. 5000 10 000 500 Comment obtenir une information sur 8000 la distribution des dépôts, sur le montant du dépôt moyen, etc…. ?
UNE SOLUTION SIMPLE Observer tous les dépôts 5000 10 000 500 8000 MAIS IMPOSSIBLE A METTRE EN ŒUVRE …. . . car le nombre N d’observations est très grand, voire infini!
UNE AUTRE SOLUTION On observe un échantillon, c. à. d. une partie de la population 5000 8000 10 000 échantillon 500 Statistique descriptive
INTERET DE LA STATISTIQUE DESCRIPTIVE 5000 8000 Fréquence Construction d’un 10 000 modèle théorique 500 Echantillo n Dépôt moyen = 7500 € écart-type des dépôts = 2500 € Montant des dépôts
INTERET DE LA STATISTIQUE DESCRIPTIVE Servir de base à la construction d’un modèle théorique Pourquoi ? Pour faire de la prévision: Quelle quantité de monnaie acheter à la Banque de France en début de semaine? Quelle quantité de liquide va-ton pouvoir faire transiter par la Suisse ? …. .
UN MODELE MATHEMATIQUE Test d’ajustement : On verra plus tard. . . X = Montant quotidien des dépôts est une variable aléatoire de loi Normale 3 affirmations de moyenne E(X) = m à vérifier de variance V(X) = s² Estimation
ESTIMATION DE LA MOYENNE m Comment avoir une idée sur la valeur de la moyenne m ? 1) Prendre rendez-vous avec Irma la voyante Problèmes: ça va me coûter cher. Puis-je lui faire confiance ? 2) Utiliser l’intuition et quelques notions de probabilités Problème: je n’ai rien compris aux probas C’est pas grave car on ne va plus s’amuser à jeter des dés ou tirer des cartes. . . Avantage: je pourrai préciser la confiance à apporter à mon résultat
UNE METHODE INTUITIVE D’ESTIMATION DE LA MOYENNE Pour estimer la moyenne m inconnue de la population on utilise la moyenne x de l’échantillon. Est-on sûr de faire mieux qu’Irma ?
UNE METHODE INTUITIVE D’ESTIMATION DE LA MOYENNE On observe n dépôts x 1, …. , xn sur un échantillon et on en fait la moyenne va-t-elle être proche de m inconnue? Et si j’insiste lourdement ? Loi de m Moins bien…. Et un autre ? Pas mal… mais que se serait-il passé si j’avais pris un autre échantillon ? Théorème fondamental: Pourquoi les observations de sont-elles concentrées Si X est une v. a. de moyenne m et d’écart-type s, alors la v. a. moyenne, notée autour de la moyenne inconnue m ? , obtenue sur un échantillon de taille n tend vers une
Prendre une décision à partir d’un échantillon, est-ce vraiment fiable ? m Fiabilité Probabilité Précision Quelle est la probabilité que la moyenne inconnue m se trouve pas trop loin de observée ? Il y a 1 -a = 95 chances sur 100 que l’intervalle contienne m
UN PEU……. . DE PROBAS…. suit une loi , donc suit une N(0, 1) Table P[-u < < u] = 1 -a = 0, 95 P[-us < -m < us u = environ 2 (1, 96) ] = 1 -a P[- -us < -m < -X+us ] = 1 -a P[ +us >m> -us ] = 1 -a P[ - us < m < +us ] = 1 -a Il y a 1 -a chances que la moyenne inconnue m appartienne à l’intervalle aléatoire
UN PEU……. . DE PROBAS…. FIN Il y a 95 chances sur 100 que la moyenne inconnue m appartienne à l’intervalle aléatoire Une observation aléatoire nous donne la valeur de . Une autre observation nous aurait donné une autre valeur , ……. et donc un autre intervalle …. qui ne contient pas forcément m m Si on peut prendre une infinité d’échantillons, 95% des intervalles contiennent m On dira (pour simplifier) que la moyenne inconnue m a 95 chances sur 100 d’appartenir à l’intervalle numérique
Fiabilité et précision a 1 -a chances de contenir m l’intervalle précision fiabilité 1 -a et u sont liés par la relation P[-u < < u] = 1 -a P[-u < N(0, 1) < u] = 1 -a Fiablité augmente u augmente 1 -a Précision diminue -u 0 u
Pour quelles raisons utiliser la moyenne de l’échantillon pour estimer la moyenne de la population ? 1) Pour des raisons intuitives 2) Pour des raisons théoriques Variable T quelconque m m pour Pour T On a une forte probabilité que l’observation Plus la taille de l’échantillon grandit plus la variance diminue. Pour n infini, soit dans cette zone l’observation tombe forcément sur m. est un estimateur sans biais est un estimateur convergent
RESUME SUR L’ESTIMATION D’UNE MOYENNE d’une population Normale de variance connue Pour estimer la moyenne d’une population, on utilise la moyenne de l’échantillon Estimation ponctuelle Pour avoir une idée de la fiabilité et de la précision du résultat on utilise un intervalle de confiance Estimation par intervalle de confiance avec u défini par P[-u < N(0, 1) < u] = 1 -a précision Coefficient de confiance Détermination de la taille d’échantillon pour une précision et un coefficient de confiance donnés On veut que l’intervalle soit de la forme , donc et
ESTIMATION PONCTUELLE DE LA VARIANCE s² 1) Pour des raisons intuitives Il est naturel d’estimer la variance d’une population, par la variance de l’échantillon 2) Pour des raisons théoriques On estime la variance d’une population par la variance corrigée de l’échantillon, notée aussi s². Pourquoi ? est un estimateur sans biais de s² est un estimateur convergent de s²
ESTIMATION PAR INTERVALLE DE CONFIANCE DE LA VARIANCE s² D’UNE POPULATION NORMALE (n-1) S² suit une loi de c² à (n-1) d. d. l. s² Table a et b (> 0) pour 1 -a donné D’où un intervalle de confiance
RESUME SUR L’ESTIMATION D’UNE VARIANCE Pour estimer la variance s² d’une population, on utilise la variance corrigée s² de l’échantillon Pour avoir une idée de la fiabilité et de la précision du résultat on utilise un intervalle de confiance avec a et b définis par Estimation ponctuelle Estimation par intervalle de confiance
ESTIMATION PONCTUELLE D’UNE PROPORTION Dans la population il y a une proportion p d’individus possédant un certain caractère. 1) Pour des raisons intuitives Il est naturel d’estimer la proportion p d’une population par la proportion f de l’échantillon 2) Pour des raisons théoriques F, proportion d’échantillon, est une v. a. qui tend vers une loi F est un estimateur sans biais de p F est un estimateur convergent de p
INTERVALLE DE CONFIANCE D’UNE PROPORTION F tend vers une , ou encore est à peu près une N(0, 1) dès que n > 100 et 0, 1 < p < 0, 9 Table u pour 1 -a donné p (dans les bornes de l’intervalle aléatoire) étant inconnu, il est approché par une estimation f, d’où un intervalle de confiance
RESUME SUR L’ESTIMATION D’UNE PROPORTION Pour estimer la proportion p d’une population, on utilise la proportion f de l’échantillon Estimation ponctuelle Estimation par intervalle de confiance Pour avoir une idée de la fiabilité et de la précision du résultat on utilise un intervalle de confiance pour n > 100 et 0, 1 < f < 0, 9 (sinon utiliser un abaque) avec u défini par P[-u < N(0, 1) < u] = 1 -a Détermination de la taille d’échantillon pour une précision et un coefficient de confiance donnés On veut que l’intervalle soit de la forme et , donc
ESTIMATION PONCTUELLE : UNE CONCLUSION X de loi quelconque de moyenne E(X) = m, de variance V(X) = s² s² La moyenne de l’échantillon est une bonne estimation de la moyenne m de la population La variance corrigée s² de l’échantillon est une bonne estimation de la variance s² de la population Proportion p d’un caractère f La proportion f de l’échantillon est une bonne estimation de la proportion p de la population
INTERVALLE DE CONFIANCE D’UNE MOYENNE: EXTENSIONS Pour obtenir un intervalle de confiance de la moyenne nous avons supposé (sans le dire) que La taille d’échantillon est grande La variance s² est connue ( ce qui en pratique est très rare ) Le taux de sondage n/N est faible ( <10% ) Que peut-on faire si ces conditions ne sont pas respectées ?
INTERVALLE DE CONFIANCE D’UNE MOYENNE EXTENSIONS Loi de Student à (n-1) d. d. l. qui est approximativement N(0, 1) pour n > 30 Dans ce tableau, on suppose que l’échantillon est prélevé avec remise, ou que l’échantillon est prélevé sans remise et le taux de sondage n/N <10 % Dans le cas d’un échantillon prélevé sans remise, et un taux de sondage n/N >10 %, on multiplie s ou s par le facteur d’exhaustivité Ce correctif doit aussi être apporté pour un intervalle de confiance d’une proportion
- Quartile en statistique
- Bascule jk front descendant
- Front montant ladder
- Auto maintien ladder
- Violino e brocca picasso
- Arts du quotidien
- Les 5 au quotidien
- Obésité canada statistique 2020
- Etendue statistique
- Vocabulaire statistique descriptive
- Chaîne de cote statistique excel
- Statistique déductive
- Comparer 2 pourcentages
- Au lycée chapitre 4 vocabulaire 1
- Comment calculer les effectifs cumulés croissants
- Statistique descriptive bivariée
- Les étapes d'une étude statistique
- Formule de la médiane en statistique
- Table de contingence
- Dut statistique et informatique décisionnelle programme
- Binarisation
- Maelys de la rupelle
- Puissance statistique définition
- Jeanne fine
- Introduction exemple
- Basic estimation techniques