ANALYSE DES CORRESPONDANCES MULTIPLES LAnalyse des correspondances multiples

  • Slides: 34
Download presentation
ANALYSE DES CORRESPONDANCES MULTIPLES

ANALYSE DES CORRESPONDANCES MULTIPLES

L’Analyse des correspondances multiples est une méthode permettant d’étudier les liaisons entre plusieurs variables

L’Analyse des correspondances multiples est une méthode permettant d’étudier les liaisons entre plusieurs variables qualitatives ou quantitatives, c’est donc une généralisation de l’AFC. Elle s’applique en particulier pour les sondages

1 Nature des données étudiées 1. 1 Données initiales Rang des individus Q 1

1 Nature des données étudiées 1. 1 Données initiales Rang des individus Q 1 1 Q 1(1) 2 Q 1(2) 3 Q 2(1) Q 3

ETUDE D’UNE ENQUETE SUR LES OPINIONS, LES ACTIVITES ET LE SEXES

ETUDE D’UNE ENQUETE SUR LES OPINIONS, LES ACTIVITES ET LE SEXES

DONNEES INITIALES Rang Sexe Opinion Politique C. S. P 1 2 3 4 5

DONNEES INITIALES Rang Sexe Opinion Politique C. S. P 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 2 2 2 2 1 1 2 1 2 2 1 4 4 2 4 3 4 5 4 3 2 3 3 1 3 5 5 4 7 3 4 1 1 6 6 2 2 3 4 2 3 3 7 Activité 1 1 1 3 3 2 2 1 1 1

Notations utilisées: Ø Qi : variable i Ø Qi(j): valeur de la variable Qi

Notations utilisées: Ø Qi : variable i Ø Qi(j): valeur de la variable Qi pour l’individu j Ø n: nombre d’individus (20) Ø q: nombre de variables (q=4) Ø mk: nombre de modalités de la variable Qk Ø M: nombre total de modalités (m=17)

CODAGE DES DONNEES Codage : Q 1 : Masc = 1 et Fem =

CODAGE DES DONNEES Codage : Q 1 : Masc = 1 et Fem = 2 Q 2 : EG =1 ; G =2 ; C =3 ; D =4 ; ED =5 Q 3 : AGRI =1 ; EMP = 2 ; OUV = 3 ; CM = 4 ; CS =5 ; PIC = 6 ; AUT = 7 Q 4 : ACT = 1 ; CHO = 2 ; RET = 3

1. 2 Tableau disjonctif complet Ø On associe à chaque modalité une variable appelée

1. 2 Tableau disjonctif complet Ø On associe à chaque modalité une variable appelée variable indicatrice ne prenant que les valeurs 1 et 0 selon que la modalité est vérifiée ou non. Ø Xj: variable indicatrice de la modalité j (de j=1 à m 1 pour la première modalité, de j=m 1+1 à m 1+m 2 pour la deuxième. . . ) Ø Xj(k): valeur (0 ou 1) de la variable indicatrice Xj pour l’individu k

Individus 1 2 3 Q 1 Q 2 X 1 X 2. . .

Individus 1 2 3 Q 1 Q 2 X 1 X 2. . . Xm 1+1. . . . . Xm 2 X 1(1)X 2(2). . . Xm 1(1) Q 3

TABLEAU DISJONCTIF COMPLET Rang 1 2 3 4 5 6 7 8 9 10

TABLEAU DISJONCTIF COMPLET Rang 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Sexe Opinion Politique C. S. P Activité M F EG G C D ED A E O CM CS P A A C R 1 0 0 1 0 1 1 0 0 1 1 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 1 1 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 1 0 0 1 0 0 1 0 0 0 0 1 0 1 0 0 1 0 0

Remarques: Ø La somme des termes de chaque ligne est égale à q. Ø

Remarques: Ø La somme des termes de chaque ligne est égale à q. Ø La somme des termes de la colonne associée à la variable Xj est notée nj. Ø La fréquence associée, appelée fréquence marginale est notée pj. Ø pj =nj/nq Ø Une ACM n’est intéressante que si le nombre d’individus est très grand ainsi que le nombre de modalités Ø Les individus doivent être répartis assez régulièrement.

FREQUENCES MARGINALES M effectifs fréq F 9 11 11, 2 13, 8 EG G

FREQUENCES MARGINALES M effectifs fréq F 9 11 11, 2 13, 8 EG G C D ED 2 3 8 6 1 2, 5 3, 8 10 7, 5 1, 3 A E O CM CS P A A C R 2 3 4 3 4 2 2 15 2 3 2, 5 3, 8 5 3, 8 5 2, 5 18, 9 2, 5 3, 8

1. 3 Eléments supplémentaires On peut introduire des éléments supplémentaires par opposition aux données

1. 3 Eléments supplémentaires On peut introduire des éléments supplémentaires par opposition aux données actives sur lesquelles portent l’Analyse mathématique. Ø Colonnes: variables indicatrices de variables dont on ne tient pas compte, variables explicatives (âge, sexe, lieu. . . ). . . Ø Lignes: individus ne faisant pas partie de la population étudiée, individus moyenne d’un groupe (dans ce cas les valeurs sont des fréquences, la somme est encore égale à m)

TABLEAU DES VARIABLES Variables actives Rang 1 2 3 4 5 6 7 8

TABLEAU DES VARIABLES Variables actives Rang 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Sexe Op Pol C. S. P Variables supplémentaires Act Op Pol Activité M F G C D O-E CAD DIV A IN EG G C D ED 1 0 0 1 0 1 1 0 0 1 1 0 0 1 1 0 0 0 0 1 0 0 0 1 0 1 0 0 0 1 0 1 0 0 0 1 0 1 0 0 1 1 0 0 1 1 0 1 0 0 1 0 0 0 1 0 0 0 1 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 1 0 0 0 1 0 1 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 1 1 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0 1 A C R

2. Description de la méthode La méthode est basée, comme en AFC sur l’étude

2. Description de la méthode La méthode est basée, comme en AFC sur l’étude des distances entre PFL et PFC et sur l’analyse des proximités et des éloignements. Attention: Contrairement à l’AFC, il ne s’agit pas de s’intéresser à l’indépendance.

2. 1 Notion de distance On définit une distance du χ2: Ø Pour les

2. 1 Notion de distance On définit une distance du χ2: Ø Pour les individus:

Ø Pour les modalités

Ø Pour les modalités

Remarque Ø Plus la modalité est de fréquence faible, plus les individus sont éloignés

Remarque Ø Plus la modalité est de fréquence faible, plus les individus sont éloignés Ø Plus l’effectif d’une modalité est faible, plus la distance entre les modalités est grande. → Notion de « prime à la rareté » D’où la nécessité de regrouper certaines modalités

Distance du χ2 entre les profils colonnes MASC FEM GAU CEN DRO O-E CAD

Distance du χ2 entre les profils colonnes MASC FEM GAU CEN DRO O-E CAD DIV ACT INA MASC 0, 00 4, 04 4, 44 3, 06 2, 54 3, 17 4, 07 1, 48 4, 44 FEM 4, 04 0, 00 3, 64 2, 05 3, 12 2, 60 2, 73 1, 21 3, 64 GAU 4, 44 3, 64 0, 00 6, 50 6, 86 4, 57 3, 43 7, 33 3, 20 6, 40 CEN 3, 06 2, 05 6, 50 0, 00 5, 36 1, 79 4, 64 4, 17 1, 50 5, 50 DRO 2, 54 3, 12 6, 86 5, 36 0, 00 5, 71 3, 27 2, 38 2, 67 3, 43 O-E 2, 54 3, 12 4, 57 1, 79 5, 71 0, 00 5, 71 6, 19 2, 29 4, 57 CAD 3, 17 2, 60 3, 43 4, 64 3, 27 5, 71 0, 00 6, 19 1, 52 6, 86 DIV 4, 07 2, 73 7, 33 4, 17 2, 38 6, 19 0, 00 3, 33 ACT 1, 48 1, 21 3, 20 1, 50 2, 67 2, 29 1, 52 3, 33 0, 00 5, 33 INA 4, 44 3, 64 6, 40 5, 50 3, 43 4, 57 6, 86 3, 33 5, 33 0, 00

2. 2 Analyse Mathématique L’Analyse mathématique se traite de la même manière qu’en AFC.

2. 2 Analyse Mathématique L’Analyse mathématique se traite de la même manière qu’en AFC. En particulier en ce qui concerne les valeurs propres. L’inertie totale est égale à

Valeurs propres de l’AFC du tableau disjonctif complet λ 1 λ 2 0, 440

Valeurs propres de l’AFC du tableau disjonctif complet λ 1 λ 2 0, 440 λ 3 0, 371 λ 4 0, 276 λ 5 0, 248 λ 6 0, 108 λ 7 0, 056 λ 8 0, 000 λ 9 0, 000

COMPOSANTES PRINCIPALES SUR LES AXES 1, 2 & 3 Axe 1 1 Axe 2

COMPOSANTES PRINCIPALES SUR LES AXES 1, 2 & 3 Axe 1 1 Axe 2 1&2 Axe 3 1&2&3 VARIABLES coord qlt cr cum. coord. qlt cr cum. MASC -0, 060 0, 003 0, 001 0, 003 0, 036 0, 001 0, 000 0, 004 -1, 078 0, 951 0, 474 0, 955 FEM 0, 049 GAU -0, 779 CEN -0, 431 DRO 1, 049 O-E -0, 641 CAD -0, 440 DIV 1, 261 ACT -0, 391 INACT 1, 173 0, 003 0, 202 0, 124 0, 592 0, 221 0, 104 0, 681 0, 459 0, 001 0, 086 0, 042 0, 219 0, 082 0, 038 0, 271 0, 065 0, 195 0, 003 0, 202 0, 124 0, 592 0, 221 0, 104 0, 681 0, 459 -0, 029 0, 693 -0, 925 0, 562 -0, 987 1, 169 -0, 212 0, 162 -0, 485 0, 001 0, 160 0, 570 0, 170 0, 524 0, 735 0, 019 0, 078 0, 000 0, 081 0, 230 0, 074 0, 230 0, 322 0, 009 0, 013 0, 040 0, 004 0, 363 0, 694 0, 762 0, 745 0, 840 0, 701 0, 537 0, 882 0, 169 0, 218 -0, 370 -0, 359 0, 098 0, 306 0, 023 -0, 070 0, 951 0, 009 0, 032 0, 074 0, 070 0, 005 0, 040 0, 002 0, 388 0, 006 0, 017 0, 043 0, 041 0, 003 0, 025 0, 000 0, 001 0, 955 0, 372 0, 726 0, 836 0, 815 0, 845 0, 741 0, 539

 INDIVIDUS Axe 1 1 coord. qlt cr L 1 -0, 629 0, 247

INDIVIDUS Axe 1 1 coord. qlt cr L 1 -0, 629 0, 247 0, 045 L 2 -0, 588 0, 231 L 3 0, 060 L 4 cum. Axe 2 1&2 coord qlt cr 0, 247 0, 845 0, 445 0, 096 0, 039 0, 231 0, 818 0, 446 0, 003 0, 000 0, 003 0, 791 0, 100 0, 008 0, 001 0, 008 L 5 -0, 588 0, 231 0, 039 L 6 1, 331 0, 884 L 7 -0, 533 L 8 cum. Axe 3 1&2&3 coord. qlt cr cum. 0, 692 -0, 375 0, 088 0, 026 0, 780 0, 090 0, 676 0, 558 0, 207 0, 056 0, 884 0, 475 0, 084 0, 478 -0, 632 0, 303 0, 072 0, 781 0, 765 0, 480 0, 079 0, 489 0, 301 0, 075 0, 016 0, 563 0, 231 0, 818 0, 446 0, 090 0, 676 0, 558 0, 207 0, 056 0, 884 0, 201 0, 884 -0, 067 0, 002 0, 001 0, 887 0, 356 0, 063 0, 023 0, 950 0, 252 0, 032 0, 252 -0, 730 0, 473 0, 072 0, 725 0, 364 0, 117 0, 024 0, 842 0, 060 0, 003 0, 000 0, 003 0, 791 0, 475 0, 084 0, 478 -0, 632 0, 303 0, 072 0, 781 L 9 0, 184 0, 027 0, 004 0, 027 -0, 412 0, 136 0, 023 0, 164 0, 680 0, 371 0, 084 0, 535 L 10 0, 700 0, 341 0, 056 0, 341 0, 224 0, 035 0, 007 0, 376 -0, 533 0, 198 0, 052 0, 574 L 11 1, 290 0, 791 0, 189 0, 791 -0, 041 0, 000 0, 792 -0, 577 0, 158 0, 060 0, 950 L 12 1, 331 0, 884 0, 201 0, 884 -0, 067 0, 002 0, 001 0, 887 0, 356 0, 063 0, 023 0, 950 L 13 0, 016 0, 000 -0, 969 0, 495 0, 126 0, 495 -0, 613 0, 199 0, 068 0, 694 L 14 -0, 075 0, 003 0, 001 0, 003 -0, 331 0, 051 0, 015 0, 053 0, 296 0, 040 0, 016 0, 094 L 15 -0, 573 0, 268 0, 037 0, 268 -0, 704 0, 403 0, 067 0, 671 -0, 569 0, 264 0, 059 0, 935 L 16 -0, 457 0, 185 0, 024 0, 185 0, 154 0, 021 0, 003 0, 206 0, 581 0, 300 0, 061 0, 506 L 17 -0, 533 0, 252 0, 032 0, 252 -0, 730 0, 473 0, 072 0, 725 0, 364 0, 117 0, 024 0, 842 L 18 -0, 573 0, 268 0, 037 0, 268 -0, 704 0, 403 0, 067 0, 671 -0, 569 0, 264 0, 059 0, 935 L 19 -0, 705 0, 310 0, 056 0, 310 -0, 039 0, 001 0, 000 0, 311 -0, 593 0, 219 0, 064 0, 530 L 20 0, 184 0, 027 0, 004 0, 027 -0, 412 0, 136 0, 023 0, 164 0, 680 0, 371 0, 084 0, 535

REPRESENTATIONS GRAPHIQUES

REPRESENTATIONS GRAPHIQUES

2. 3 Tableau de BURT Une autre méthode consiste à réaliser l’AFC du tableau

2. 3 Tableau de BURT Une autre méthode consiste à réaliser l’AFC du tableau croisé, appelé tableau de BURT obtenu en croisant les diverses modalités.

TABLEAU DE BURT MASC FEM GAU CEN DRO O-E CAD DIV ACT INA MASC

TABLEAU DE BURT MASC FEM GAU CEN DRO O-E CAD DIV ACT INA MASC 9 0 2 3 4 4 3 2 7 2 FEM 0 11 3 5 3 3 4 4 8 3 GAU 2 3 5 0 0 2 3 0 4 1 CEN 3 5 0 8 0 5 1 2 7 1 DRO 4 3 0 0 7 0 3 4 4 3 O-E 4 3 2 5 0 7 0 0 5 2 CAD 3 4 3 1 3 0 7 0 DIV 2 4 0 0 6 3 3 ACT 7 8 4 7 4 5 7 3 15 0 INA 2 3 1 1 3 2 0 3 0 5

PROPRIETE DES BLOCS DIAGONAUX MASC FEM GAU CEN DRO O-E CAD DIV ACT INA

PROPRIETE DES BLOCS DIAGONAUX MASC FEM GAU CEN DRO O-E CAD DIV ACT INA MASC 9 0 2 3 4 4 3 2 7 2 FEM 0 11 3 5 3 3 4 4 8 3 GAU 2 3 5 0 0 2 3 0 4 1 CEN 3 5 0 8 0 5 1 2 7 1 DRO 4 3 0 0 7 0 3 4 4 3 O-E 4 3 2 5 0 7 0 0 5 2 CAD 3 4 3 1 3 0 7 0 DIV 2 4 0 0 6 3 3 ACT 7 8 4 7 4 5 7 3 15 0 INA 2 3 1 1 3 2 0 3 0 5

PROPRIETE DES LIGNES MASC FEM GAU CEN DRO O-E CAD DIV ACT INA MASC

PROPRIETE DES LIGNES MASC FEM GAU CEN DRO O-E CAD DIV ACT INA MASC 9 0 2 3 4 4 3 2 7 2 FEM 0 11 3 5 3 3 4 4 8 3 GAU 2 3 5 0 0 2 3 0 4 1 CEN 3 5 0 8 0 5 1 2 7 1 DRO 4 3 0 0 7 0 3 4 4 3 O-E 4 3 2 5 0 7 0 0 5 2 CAD 3 4 3 1 3 0 7 0 DIV 2 4 0 0 6 3 3 ACT 7 8 4 7 4 5 7 3 15 0 INA 2 3 1 1 3 2 0 3 0 5

PROPRIETE DES COLONNES MASC FEM GAU CEN DRO O-E CAD DIV ACT INA MASC

PROPRIETE DES COLONNES MASC FEM GAU CEN DRO O-E CAD DIV ACT INA MASC 9 0 2 3 4 4 3 2 7 2 FEM 0 11 3 5 3 3 4 4 8 3 GAU 2 3 5 0 0 2 3 0 4 1 CEN 3 5 0 8 0 5 1 2 7 1 DRO 4 3 0 0 7 0 3 4 4 3 O-E 4 3 2 5 0 7 0 0 5 2 CAD 3 4 3 1 3 0 7 0 DIV 2 4 0 0 6 3 3 ACT 7 8 4 7 4 5 7 3 15 0 INA 2 3 1 1 3 2 0 3 0 5

PROPRIETE DES BLOCS SOUSDIAGONAUX MASC FEM GAU CEN DRO O-E CAD DIV ACT INA

PROPRIETE DES BLOCS SOUSDIAGONAUX MASC FEM GAU CEN DRO O-E CAD DIV ACT INA MASC 9 0 2 3 4 4 3 2 7 2 FEM 0 11 3 5 3 3 4 4 8 3 GAU 2 3 5 0 0 2 3 0 4 1 CEN 3 5 0 8 0 5 1 2 7 1 DRO 4 3 0 0 7 0 3 4 4 3 O-E 4 3 2 5 0 7 0 0 5 2 CAD 3 4 3 1 3 0 7 0 DIV 2 4 0 0 6 3 3 ACT 7 8 4 7 4 5 7 3 15 0 INA 2 3 1 1 3 2 0 3 0 5

Propriétés du tableau de BURT Ø Les valeurs propres de l’AFC du tableau de

Propriétés du tableau de BURT Ø Les valeurs propres de l’AFC du tableau de BURT sont les carrés des valeurs propres de l’AFC du tableau disjonctif complet (TDC). Ø Les composantes principales des modalités sont celles du TDC multipliées par la racine carrée de la valeur propre correspondante dans l’AFC du TDC.

Propriétés des individus Les individus n’apparaissent pas dans cette méthode mais on peut les

Propriétés des individus Les individus n’apparaissent pas dans cette méthode mais on peut les faire apparaître en éléments supplémentaires. Ø Les composantes principales des individus sont les mêmes que dans l’AFC du TDC. Ø Les points modalités sont les isobarycentres des points individus vérifiant la modalité.