Paramtres statistiques Paramtres de Tendance Centrale et de

  • Slides: 17
Download presentation
Paramètres statistiques : Paramètres de : Tendance Centrale et de Dispersion

Paramètres statistiques : Paramètres de : Tendance Centrale et de Dispersion

Définition : Les paramètres statistiques permettent de procéder à un résumé à partir d’un

Définition : Les paramètres statistiques permettent de procéder à un résumé à partir d’un échantillon de quelques nombres significatifs des informations les plus importantes relatives à l'observation d'une variable quantitative Les objectifs de la statistique descriptive sont de décrire, de synthétiser, de comparer des données recueillies sur un phénomène donné au cours de différentes périodes ou en différents endroits. Elle permet ensuite de prendre des décisions rationnelles.

Population : Ensemble de référence sur lequel vont porter les observations. Taille de la

Population : Ensemble de référence sur lequel vont porter les observations. Taille de la population : N Caractère : le caractère de la série est l’élément de mesure. Il existe deux types de caractères : n Quantitatif ( Poids, taille, chiffre d’affaires …. ) n Qualitatif ( nationalité, couleur de voiture …. . ) Les différentes valeurs que peut prendre un caractère quantitatif s’appellent les modalités de la série Si la modalité prend des valeurs entières on parle de variables discrètes ( ex: Nombre d’enfants …. . ) Si la modalité prend toute valeur dans un intervalle de mesure on parle de variables continues : ( ex : taille, poids …. . )

Série Brute : 6 6 5 4 0 2 3 1… Série ordonnée, groupée

Série Brute : 6 6 5 4 0 2 3 1… Série ordonnée, groupée : Distribution observée : Nombre d’enfants Nombre de familles 0 1 2 3 4 6 4 5 2 1

Grâce aux données précédentes, nous pouvons dire par exemple : n le nombre moyen

Grâce aux données précédentes, nous pouvons dire par exemple : n le nombre moyen d'enfants par famille est de 1. 33 n Ces familles ont entre 0 et 4 enfants, n 50 % des familles ont moins de 2 enfants, n les 2/3 des familles ont au moins 1 enfant, etc.

Certains, comme la moyenne, moyenne seront dits de tendance centrale car ils représentent une

Certains, comme la moyenne, moyenne seront dits de tendance centrale car ils représentent une valeur numérique autour de laquelle les observations sont réparties D'autres, seront dits de dispersion car ils permettent de résumer le plus ou moins grand étalement des observations de part et d'autre de la tendance centrale

I. Les paramètres de tendance centrale I. 1 - La moyenne arithmétique d'une série

I. Les paramètres de tendance centrale I. 1 - La moyenne arithmétique d'une série brute numérique x 1 , x 2 , . . . , xn est : le quotient de la somme des observations par leur nombre : Prenons un exemple : Familles Nombre d’enfants A B C C E F G H 2 3 0 1 2 4 1 2 Somme 15 la moyenne du nombre d’enfant = (2+3+0+1+2+4+1+2)/8 Dans EXCEL : =moyenne( : ) Ici = moyenne(C 4: C 11) soit 1. 875 Petit rappel : correspond à de cellule à cellule alors que ; correspond à cellule x et cellule y

I. 2 - La moyenne pondérée qui tient compte de l’effectif : - Fréquence

I. 2 - La moyenne pondérée qui tient compte de l’effectif : - Fréquence fi = -Moyenne ni arithmétique pondérée x= ou xifi xini ni Dans EXCEL : nous appliquons les formules mathématiques, et nous utilisons les fonctions SOMME. PROD() ET SOMME() Exemple 1 : le cas d’une variable discrète Exemple 2 : Le cas d’une variable continue

I. 3 - Le Mode : Définition mathématique : n Cas d’une variable discrète

I. 3 - Le Mode : Définition mathématique : n Cas d’une variable discrète : valeur de la classe qui présente l’effectif le plus élevé Cas d’une variable continue : on parle de classe modale en désignant la classe regroupant le plus grand nombre d’observations n n. La représentation graphique est ici une aide efficace n. Dans EXCEL : nous appliquons les formules mathématiques, et nous utilisons les fonctions SI() et MAX()

I. 4 – La Médiane : La médiane représente la valeur de la variable

I. 4 – La Médiane : La médiane représente la valeur de la variable telle que 50 % des effectifs ont une valeur inférieure à cette médiane et 50 % des effectifs ont une valeur supérieure. n. On peut la déterminer grâce à un graphique : Le point de rencontre de deux courbes cumulées Exemple 3 : insérer un graphique n. Mais également grâce à un calcul l’interpolation linéaire : on calcul les effectifs cumulés, la médiane se situe à 50% Exemple 3 : interpolation linéaire Lien vers un cours en ligne très explicatif : Maths Web

II. Les paramètres de Dispersion Ces paramètres sont des valeurs qui caractérisent le plus

II. Les paramètres de Dispersion Ces paramètres sont des valeurs qui caractérisent le plus ou moins grand étalement d’une série statistique. Ils permettent d’étudier la dispersion des données autour de la moyenne. II. 1 – L’étendue C’est la différence entre les valeurs extrêmes de la variable. exemple : Nombre d’enfants Nombre de familles 0 1 2 3 4 6 2 5 2 1 Valeur extrême la plus haute : 6 Valeur extrême la plus basse : 1 6 -1=5 L’étendue est donc de 5

n. Dans Excel : Excel ne peut calculer l’étendue que sur des valeurs ponctuelles

n. Dans Excel : Excel ne peut calculer l’étendue que sur des valeurs ponctuelles (qui n'ont pas été classées). Pour des valeurs discrètes : [=max( : )-min( : )]

II. 2 – Les quartiles Ils correspondent à des valeurs pour lesquelles on a

II. 2 – Les quartiles Ils correspondent à des valeurs pour lesquelles on a classé la population : 25 %, 50 % , 75 % ( 1 er quartile , 2ème quartile ou médiane, 3ème quartile ) Les calculs algébriques se font comme pour la médiane par interpolation linéaire. Excel ne met pas en œuvre les mêmes définitions ! On calcul 25%, 50% ou 75% de ces effectifs cumulés

II. 3 – Variance et écart type La variance est la moyenne des carrés

II. 3 – Variance et écart type La variance est la moyenne des carrés des écarts des valeurs de la série par rapport à la moyenne. Variance V= nixi 2 _ x 2 ou ni ( xi - x )2 ou ( xi - x )2 fi ni L'écart type évalue la dispersion d'une population en se basant sur un échantillon de cette population autour de la moyenne. Ecart-type = racine carré de V L'écart type sert à mesurer la dispersion d'un ensemble de données. Plus il est faible, plus les valeurs sont regroupées autour de la moyenne. Par exemple pour la répartition des notes d'une classe, plus l'écart type est faible, plus la classe est homogène. À l'inverse, s’il est plus important, les notes sont moins resserrées.

n Dans Excel : Variance Pour des valeurs discrètes : [=VAR. P( : )]

n Dans Excel : Variance Pour des valeurs discrètes : [=VAR. P( : )] Remarque : ne pas utiliser la fonction VAR qui est réservée à l'estimation de la variance d'une population à partir d'un échantillon Écart type Pour des valeurs discrètes : [= ECARTYPEP( : )]

Nous pouvons interpréter ces résultats de la façon suivante : Dans notre exemple, l’écart

Nous pouvons interpréter ces résultats de la façon suivante : Dans notre exemple, l’écart type est de 1, 02 autour de la moyenne 1. 6 En ce qui concerne la variance est de 1, 04 autour de la moyenne 1. 6 Nous pouvons donc conclure que nous ne sommes pas dans le cadre d’une grande dispersion dans ce cas précis. Un second exemple dont la base est semblable, pour une même moyenne, nous obtenons un écart type et une variance beaucoup plus importants : la dispersion autour de la moyenne est beaucoup plus importante, la variance étant de 3. 04 et l’écart type de 1. 74 (pour une moyenne semblable de 1. 6).

Les paramètres statistiques n’ont plus aucun secret pour vous… …s’il vous reste des questions,

Les paramètres statistiques n’ont plus aucun secret pour vous… …s’il vous reste des questions, demandez à votre professeur… I. MAISSE – Lycée Pergaud – BTS SP 3 S – 2007/2008