Linfrence statistique Rsum R Infrence Tendances centrales mode

  • Slides: 32
Download presentation
L’inférence statistique

L’inférence statistique

Résumé ? R Inférence Tendances centrales (mode, médiane, moyenne) Variabilités (é-t, var)

Résumé ? R Inférence Tendances centrales (mode, médiane, moyenne) Variabilités (é-t, var)

Plan n n n Définition Formulation d’hypothèses Prise de décision Distribution d’échantillonnage moyen Test

Plan n n n Définition Formulation d’hypothèses Prise de décision Distribution d’échantillonnage moyen Test de signification Intervalles de confiance

Inférence statistique n Définition de l’inférence: généralisation d’un échantillon à une population. n 2

Inférence statistique n Définition de l’inférence: généralisation d’un échantillon à une population. n 2 cas: n n Est-ce qu’un échantillon observé appartient à une population « hypothétique » Est-ce que les observations de 2 groupes de sujets représentes des échantillons d’une même population ou de deux populations différentes

Inférence statistique n Première possibilité x x x x x ? Inférence ?

Inférence statistique n Première possibilité x x x x x ? Inférence ?

Inférence statistique n Deuxième possibilité x x x x x ? Inférence ?

Inférence statistique n Deuxième possibilité x x x x x ? Inférence ?

Formulation d’hypothèses 1 2 On test H 0

Formulation d’hypothèses 1 2 On test H 0

Prise de décision n À partir des échantillons on décide de rejeter ou non

Prise de décision n À partir des échantillons on décide de rejeter ou non l’hypothèse nulle. n En faisant de l’inférence, on n’est jamais certains de prendre la bonne décision Population Échantillon Décision Identique Différente Identique Bonne Erreur 2 Différente Erreur 1 Bonne

Prise de décision n 2 Erreurs: n 1 - Inférer que 2 groupes font

Prise de décision n 2 Erreurs: n 1 - Inférer que 2 groupes font partie de 2 populations différentes alors qu’en réalité elles font partie de la même population. On rejette H 0 alors que H 0 est vraie. n 2 – Inférer que 2 groupes font partie de la même population alors qu’en réalité elles font partie de populations différentes. On accepte H 0 alors que H 0 est fausse. Population Échantillon Décision Identique Différente Identique Bonne Erreur 2 Différente Erreur 1 Bonne

1 - inférence à propos de la moyenne de la population Distribution d’échantillonnage moyen

1 - inférence à propos de la moyenne de la population Distribution d’échantillonnage moyen Échantillons (n) Population Distribution d’échantillonnage moyen

Distribution d’échantillonnage moyen n Caractéristiques: n n Elle se distribuera selon une courbe normale

Distribution d’échantillonnage moyen n Caractéristiques: n n Elle se distribuera selon une courbe normale Elle aura une moyenne égale à celle de la population Elle aura un écart-type égal à la celui de la population divisé par la racine carré de la grandeur de l’échantillon. Plus l’échantillon est grand, moins on risque de faire une erreur en inférant la valeur de la moyenne de la population à partir d’un échantillon.

Distribution d’échantillonnage moyen N=9 Population Échantillons Distribution d’échantillonnage moyen

Distribution d’échantillonnage moyen N=9 Population Échantillons Distribution d’échantillonnage moyen

Distribution d’échantillonnage moyen N=16 Population Échantillons Distribution d’échantillonnage moyen

Distribution d’échantillonnage moyen N=16 Population Échantillons Distribution d’échantillonnage moyen

Distribution d’échantillonnage moyen N=36 Population Échantillons Distribution d’échantillonnage moyen

Distribution d’échantillonnage moyen N=36 Population Échantillons Distribution d’échantillonnage moyen

Distribution d’échantillonnage moyen N=144 Population Échantillons Distribution d’échantillonnage moyen

Distribution d’échantillonnage moyen N=144 Population Échantillons Distribution d’échantillonnage moyen

Test de signification n Si on présuppose que l’hypothèse nulle est vraie, quelle est

Test de signification n Si on présuppose que l’hypothèse nulle est vraie, quelle est la probabilité d’obtenir une moyenne d’échantillonnage aussi grande que celle observée ? Si c’est peu probable on rejette H 0, sinon on conserve H 0. Peu probable: 5% ou 1% (convention) = a = seuil de signification 2 possibilités 1 - Unicaudale (Basée sur des expériences antérieures) Ho conservée Ho rejetée Si a = 0. 05, za = ?

Règle de décision n Si on assume que l’hypothèse nulle est vraie, quelle est

Règle de décision n Si on assume que l’hypothèse nulle est vraie, quelle est la probabilité d’obtenir une moyenne d’échantillonnage aussi grande que celle observée ? Si c’est peu probable on rejette H 0, sinon on conserve H 0. Peu probable: 5% ou 1% (convention) = a = seuil de signification Ho conservée On conserve H 0 Ho rejetée On rejette H 0

Test de signification Exemple n n n H 0: m = 72 H 1:

Test de signification Exemple n n n H 0: m = 72 H 1: m < 72 (basée sur des expériences antérieures) a = 0. 05 (5%) s = 9 = 65 n = 36

Test de signification 2 - bicaudale (par défaut) Ho rejetée Ho conservée Ho rejetée

Test de signification 2 - bicaudale (par défaut) Ho rejetée Ho conservée Ho rejetée Si a = 0. 05, za = ?

Test de signification Exemple 2 n n n H 0: m = 72 H

Test de signification Exemple 2 n n n H 0: m = 72 H 1: m 72 (par défaut) a = 0. 05 (5%) s = 9 = 68 n = 36

Intervalles de confiance n On n’est jamais certains que la moyenne tirée de notre

Intervalles de confiance n On n’est jamais certains que la moyenne tirée de notre échantillon est exactement la véritable moyenne de la population. Donc, au lieu de donnée uniquement la moyenne, il existe une façon de quantifier notre degré de certitude voulue en spécifiant un intervalle aux alentours de la moyenne.

Intervalles de confiance Exemple: IC = 95% n n n = 50, 7 n

Intervalles de confiance Exemple: IC = 95% n n n = 50, 7 n = 100 s = 20

Intervalles de confiance Exemple: IC = 99% n n n = 50, 7 n

Intervalles de confiance Exemple: IC = 99% n n n = 50, 7 n = 100 s = 20

Relation entre le test d’hypothèse et les intervalles de confiance

Relation entre le test d’hypothèse et les intervalles de confiance

2 - inférence à propos de la différence entre des moyennes de la population

2 - inférence à propos de la différence entre des moyennes de la population Distribution d’échantillonnage des différences entre les moyennes Échantillons (n) Population Distribution d’échantillonnage moyen

Distribution d’échantillonnage des différences entre les moyennes n Caractéristiques: n n n Elle se

Distribution d’échantillonnage des différences entre les moyennes n Caractéristiques: n n n Elle se distribuera selon une courbe normale Elle aura une moyenne égale à 0 (m 1 -m 2=0) Elle aura un écart-type égal à :

Règle de décision Ho conservée On conserve H 0 Ho rejetée On rejette H

Règle de décision Ho conservée On conserve H 0 Ho rejetée On rejette H 0

Test de signification Exemple: probabilité d’observer la différence entre les groupes suivants ? n

Test de signification Exemple: probabilité d’observer la différence entre les groupes suivants ? n n n H 0: m 1 = m 2 (m 1 - m 2 = 0) H 1: m 1 m 2 (m 1 - m 2 0) a = 0. 05 (5%) n n n = 50 s 1 = 5 n 1 = 36 n n n = 48 s 2 = 5 n 2 = 36

Test de signification Exemple: probabilité d’observer la différence entre les groupes suivants ? n

Test de signification Exemple: probabilité d’observer la différence entre les groupes suivants ? n n n H 0: m 1 = m 2 (m 1 - m 2 = 0) H 1: m 1 m 2 (m 1 - m 2 0) a = 0. 05 (5%) n n n = 50 s 1 = 5 n 1 = 36 n n n = 48 s 2 = 5 n 2 = 36

Intervalles de confiance

Intervalles de confiance

Test de signification Exemple: Intervalle de confiance à 95% n n n H 0:

Test de signification Exemple: Intervalle de confiance à 95% n n n H 0: m 1 = m 2 (m 1 - m 2 = 0) H 1: m 1 m 2 (m 1 - m 2 0) a = 0. 05 (5%) n n n = 50 s 1 = 5 n 1 = 36 n n n = 48 s 2 = 5 n 2 = 36

Test de signification Exemple: Intervalle de confiance à 95% n n n H 0:

Test de signification Exemple: Intervalle de confiance à 95% n n n H 0: m 1 = m 2 (m 1 - m 2 = 0) H 1: m 1 m 2 (m 1 - m 2 0) a = 0. 05 (5%) n n n = 50 s 1 = 5 n 1 = 36 n n n = 48 s 2 = 5 n 2 = 36