ANALYSE DES CORRESPONDANCES MULTIPLES LAnalyse des correspondances multiples
- Slides: 34
ANALYSE DES CORRESPONDANCES MULTIPLES
L’Analyse des correspondances multiples est une méthode permettant d’étudier les liaisons entre plusieurs variables qualitatives ou quantitatives, c’est donc une généralisation de l’AFC. Elle s’applique en particulier pour les sondages
1 Nature des données étudiées 1. 1 Données initiales Rang des individus Q 1 1 Q 1(1) 2 Q 1(2) 3 Q 2(1) Q 3
ETUDE D’UNE ENQUETE SUR LES OPINIONS, LES ACTIVITES ET LE SEXES
DONNEES INITIALES Rang Sexe Opinion Politique C. S. P 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 2 2 2 2 1 1 2 1 2 2 1 4 4 2 4 3 4 5 4 3 2 3 3 1 3 5 5 4 7 3 4 1 1 6 6 2 2 3 4 2 3 3 7 Activité 1 1 1 3 3 2 2 1 1 1
Notations utilisées: Ø Qi : variable i Ø Qi(j): valeur de la variable Qi pour l’individu j Ø n: nombre d’individus (20) Ø q: nombre de variables (q=4) Ø mk: nombre de modalités de la variable Qk Ø M: nombre total de modalités (m=17)
CODAGE DES DONNEES Codage : Q 1 : Masc = 1 et Fem = 2 Q 2 : EG =1 ; G =2 ; C =3 ; D =4 ; ED =5 Q 3 : AGRI =1 ; EMP = 2 ; OUV = 3 ; CM = 4 ; CS =5 ; PIC = 6 ; AUT = 7 Q 4 : ACT = 1 ; CHO = 2 ; RET = 3
1. 2 Tableau disjonctif complet Ø On associe à chaque modalité une variable appelée variable indicatrice ne prenant que les valeurs 1 et 0 selon que la modalité est vérifiée ou non. Ø Xj: variable indicatrice de la modalité j (de j=1 à m 1 pour la première modalité, de j=m 1+1 à m 1+m 2 pour la deuxième. . . ) Ø Xj(k): valeur (0 ou 1) de la variable indicatrice Xj pour l’individu k
Individus 1 2 3 Q 1 Q 2 X 1 X 2. . . Xm 1+1. . . . . Xm 2 X 1(1)X 2(2). . . Xm 1(1) Q 3
TABLEAU DISJONCTIF COMPLET Rang 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Sexe Opinion Politique C. S. P Activité M F EG G C D ED A E O CM CS P A A C R 1 0 0 1 0 1 1 0 0 1 1 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 1 1 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 1 0 0 1 0 0 1 0 0 0 0 1 0 1 0 0 1 0 0
Remarques: Ø La somme des termes de chaque ligne est égale à q. Ø La somme des termes de la colonne associée à la variable Xj est notée nj. Ø La fréquence associée, appelée fréquence marginale est notée pj. Ø pj =nj/nq Ø Une ACM n’est intéressante que si le nombre d’individus est très grand ainsi que le nombre de modalités Ø Les individus doivent être répartis assez régulièrement.
FREQUENCES MARGINALES M effectifs fréq F 9 11 11, 2 13, 8 EG G C D ED 2 3 8 6 1 2, 5 3, 8 10 7, 5 1, 3 A E O CM CS P A A C R 2 3 4 3 4 2 2 15 2 3 2, 5 3, 8 5 3, 8 5 2, 5 18, 9 2, 5 3, 8
1. 3 Eléments supplémentaires On peut introduire des éléments supplémentaires par opposition aux données actives sur lesquelles portent l’Analyse mathématique. Ø Colonnes: variables indicatrices de variables dont on ne tient pas compte, variables explicatives (âge, sexe, lieu. . . ). . . Ø Lignes: individus ne faisant pas partie de la population étudiée, individus moyenne d’un groupe (dans ce cas les valeurs sont des fréquences, la somme est encore égale à m)
TABLEAU DES VARIABLES Variables actives Rang 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Sexe Op Pol C. S. P Variables supplémentaires Act Op Pol Activité M F G C D O-E CAD DIV A IN EG G C D ED 1 0 0 1 0 1 1 0 0 1 1 0 0 1 1 0 0 0 0 1 0 0 0 1 0 1 0 0 0 1 0 1 0 0 0 1 0 1 0 0 1 1 0 0 1 1 0 1 0 0 1 0 0 0 1 0 0 0 1 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 1 0 0 0 1 0 1 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 1 1 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0 1 A C R
2. Description de la méthode La méthode est basée, comme en AFC sur l’étude des distances entre PFL et PFC et sur l’analyse des proximités et des éloignements. Attention: Contrairement à l’AFC, il ne s’agit pas de s’intéresser à l’indépendance.
2. 1 Notion de distance On définit une distance du χ2: Ø Pour les individus:
Ø Pour les modalités
Remarque Ø Plus la modalité est de fréquence faible, plus les individus sont éloignés Ø Plus l’effectif d’une modalité est faible, plus la distance entre les modalités est grande. → Notion de « prime à la rareté » D’où la nécessité de regrouper certaines modalités
Distance du χ2 entre les profils colonnes MASC FEM GAU CEN DRO O-E CAD DIV ACT INA MASC 0, 00 4, 04 4, 44 3, 06 2, 54 3, 17 4, 07 1, 48 4, 44 FEM 4, 04 0, 00 3, 64 2, 05 3, 12 2, 60 2, 73 1, 21 3, 64 GAU 4, 44 3, 64 0, 00 6, 50 6, 86 4, 57 3, 43 7, 33 3, 20 6, 40 CEN 3, 06 2, 05 6, 50 0, 00 5, 36 1, 79 4, 64 4, 17 1, 50 5, 50 DRO 2, 54 3, 12 6, 86 5, 36 0, 00 5, 71 3, 27 2, 38 2, 67 3, 43 O-E 2, 54 3, 12 4, 57 1, 79 5, 71 0, 00 5, 71 6, 19 2, 29 4, 57 CAD 3, 17 2, 60 3, 43 4, 64 3, 27 5, 71 0, 00 6, 19 1, 52 6, 86 DIV 4, 07 2, 73 7, 33 4, 17 2, 38 6, 19 0, 00 3, 33 ACT 1, 48 1, 21 3, 20 1, 50 2, 67 2, 29 1, 52 3, 33 0, 00 5, 33 INA 4, 44 3, 64 6, 40 5, 50 3, 43 4, 57 6, 86 3, 33 5, 33 0, 00
2. 2 Analyse Mathématique L’Analyse mathématique se traite de la même manière qu’en AFC. En particulier en ce qui concerne les valeurs propres. L’inertie totale est égale à
Valeurs propres de l’AFC du tableau disjonctif complet λ 1 λ 2 0, 440 λ 3 0, 371 λ 4 0, 276 λ 5 0, 248 λ 6 0, 108 λ 7 0, 056 λ 8 0, 000 λ 9 0, 000
COMPOSANTES PRINCIPALES SUR LES AXES 1, 2 & 3 Axe 1 1 Axe 2 1&2 Axe 3 1&2&3 VARIABLES coord qlt cr cum. coord. qlt cr cum. MASC -0, 060 0, 003 0, 001 0, 003 0, 036 0, 001 0, 000 0, 004 -1, 078 0, 951 0, 474 0, 955 FEM 0, 049 GAU -0, 779 CEN -0, 431 DRO 1, 049 O-E -0, 641 CAD -0, 440 DIV 1, 261 ACT -0, 391 INACT 1, 173 0, 003 0, 202 0, 124 0, 592 0, 221 0, 104 0, 681 0, 459 0, 001 0, 086 0, 042 0, 219 0, 082 0, 038 0, 271 0, 065 0, 195 0, 003 0, 202 0, 124 0, 592 0, 221 0, 104 0, 681 0, 459 -0, 029 0, 693 -0, 925 0, 562 -0, 987 1, 169 -0, 212 0, 162 -0, 485 0, 001 0, 160 0, 570 0, 170 0, 524 0, 735 0, 019 0, 078 0, 000 0, 081 0, 230 0, 074 0, 230 0, 322 0, 009 0, 013 0, 040 0, 004 0, 363 0, 694 0, 762 0, 745 0, 840 0, 701 0, 537 0, 882 0, 169 0, 218 -0, 370 -0, 359 0, 098 0, 306 0, 023 -0, 070 0, 951 0, 009 0, 032 0, 074 0, 070 0, 005 0, 040 0, 002 0, 388 0, 006 0, 017 0, 043 0, 041 0, 003 0, 025 0, 000 0, 001 0, 955 0, 372 0, 726 0, 836 0, 815 0, 845 0, 741 0, 539
INDIVIDUS Axe 1 1 coord. qlt cr L 1 -0, 629 0, 247 0, 045 L 2 -0, 588 0, 231 L 3 0, 060 L 4 cum. Axe 2 1&2 coord qlt cr 0, 247 0, 845 0, 445 0, 096 0, 039 0, 231 0, 818 0, 446 0, 003 0, 000 0, 003 0, 791 0, 100 0, 008 0, 001 0, 008 L 5 -0, 588 0, 231 0, 039 L 6 1, 331 0, 884 L 7 -0, 533 L 8 cum. Axe 3 1&2&3 coord. qlt cr cum. 0, 692 -0, 375 0, 088 0, 026 0, 780 0, 090 0, 676 0, 558 0, 207 0, 056 0, 884 0, 475 0, 084 0, 478 -0, 632 0, 303 0, 072 0, 781 0, 765 0, 480 0, 079 0, 489 0, 301 0, 075 0, 016 0, 563 0, 231 0, 818 0, 446 0, 090 0, 676 0, 558 0, 207 0, 056 0, 884 0, 201 0, 884 -0, 067 0, 002 0, 001 0, 887 0, 356 0, 063 0, 023 0, 950 0, 252 0, 032 0, 252 -0, 730 0, 473 0, 072 0, 725 0, 364 0, 117 0, 024 0, 842 0, 060 0, 003 0, 000 0, 003 0, 791 0, 475 0, 084 0, 478 -0, 632 0, 303 0, 072 0, 781 L 9 0, 184 0, 027 0, 004 0, 027 -0, 412 0, 136 0, 023 0, 164 0, 680 0, 371 0, 084 0, 535 L 10 0, 700 0, 341 0, 056 0, 341 0, 224 0, 035 0, 007 0, 376 -0, 533 0, 198 0, 052 0, 574 L 11 1, 290 0, 791 0, 189 0, 791 -0, 041 0, 000 0, 792 -0, 577 0, 158 0, 060 0, 950 L 12 1, 331 0, 884 0, 201 0, 884 -0, 067 0, 002 0, 001 0, 887 0, 356 0, 063 0, 023 0, 950 L 13 0, 016 0, 000 -0, 969 0, 495 0, 126 0, 495 -0, 613 0, 199 0, 068 0, 694 L 14 -0, 075 0, 003 0, 001 0, 003 -0, 331 0, 051 0, 015 0, 053 0, 296 0, 040 0, 016 0, 094 L 15 -0, 573 0, 268 0, 037 0, 268 -0, 704 0, 403 0, 067 0, 671 -0, 569 0, 264 0, 059 0, 935 L 16 -0, 457 0, 185 0, 024 0, 185 0, 154 0, 021 0, 003 0, 206 0, 581 0, 300 0, 061 0, 506 L 17 -0, 533 0, 252 0, 032 0, 252 -0, 730 0, 473 0, 072 0, 725 0, 364 0, 117 0, 024 0, 842 L 18 -0, 573 0, 268 0, 037 0, 268 -0, 704 0, 403 0, 067 0, 671 -0, 569 0, 264 0, 059 0, 935 L 19 -0, 705 0, 310 0, 056 0, 310 -0, 039 0, 001 0, 000 0, 311 -0, 593 0, 219 0, 064 0, 530 L 20 0, 184 0, 027 0, 004 0, 027 -0, 412 0, 136 0, 023 0, 164 0, 680 0, 371 0, 084 0, 535
REPRESENTATIONS GRAPHIQUES
2. 3 Tableau de BURT Une autre méthode consiste à réaliser l’AFC du tableau croisé, appelé tableau de BURT obtenu en croisant les diverses modalités.
TABLEAU DE BURT MASC FEM GAU CEN DRO O-E CAD DIV ACT INA MASC 9 0 2 3 4 4 3 2 7 2 FEM 0 11 3 5 3 3 4 4 8 3 GAU 2 3 5 0 0 2 3 0 4 1 CEN 3 5 0 8 0 5 1 2 7 1 DRO 4 3 0 0 7 0 3 4 4 3 O-E 4 3 2 5 0 7 0 0 5 2 CAD 3 4 3 1 3 0 7 0 DIV 2 4 0 0 6 3 3 ACT 7 8 4 7 4 5 7 3 15 0 INA 2 3 1 1 3 2 0 3 0 5
PROPRIETE DES BLOCS DIAGONAUX MASC FEM GAU CEN DRO O-E CAD DIV ACT INA MASC 9 0 2 3 4 4 3 2 7 2 FEM 0 11 3 5 3 3 4 4 8 3 GAU 2 3 5 0 0 2 3 0 4 1 CEN 3 5 0 8 0 5 1 2 7 1 DRO 4 3 0 0 7 0 3 4 4 3 O-E 4 3 2 5 0 7 0 0 5 2 CAD 3 4 3 1 3 0 7 0 DIV 2 4 0 0 6 3 3 ACT 7 8 4 7 4 5 7 3 15 0 INA 2 3 1 1 3 2 0 3 0 5
PROPRIETE DES LIGNES MASC FEM GAU CEN DRO O-E CAD DIV ACT INA MASC 9 0 2 3 4 4 3 2 7 2 FEM 0 11 3 5 3 3 4 4 8 3 GAU 2 3 5 0 0 2 3 0 4 1 CEN 3 5 0 8 0 5 1 2 7 1 DRO 4 3 0 0 7 0 3 4 4 3 O-E 4 3 2 5 0 7 0 0 5 2 CAD 3 4 3 1 3 0 7 0 DIV 2 4 0 0 6 3 3 ACT 7 8 4 7 4 5 7 3 15 0 INA 2 3 1 1 3 2 0 3 0 5
PROPRIETE DES COLONNES MASC FEM GAU CEN DRO O-E CAD DIV ACT INA MASC 9 0 2 3 4 4 3 2 7 2 FEM 0 11 3 5 3 3 4 4 8 3 GAU 2 3 5 0 0 2 3 0 4 1 CEN 3 5 0 8 0 5 1 2 7 1 DRO 4 3 0 0 7 0 3 4 4 3 O-E 4 3 2 5 0 7 0 0 5 2 CAD 3 4 3 1 3 0 7 0 DIV 2 4 0 0 6 3 3 ACT 7 8 4 7 4 5 7 3 15 0 INA 2 3 1 1 3 2 0 3 0 5
PROPRIETE DES BLOCS SOUSDIAGONAUX MASC FEM GAU CEN DRO O-E CAD DIV ACT INA MASC 9 0 2 3 4 4 3 2 7 2 FEM 0 11 3 5 3 3 4 4 8 3 GAU 2 3 5 0 0 2 3 0 4 1 CEN 3 5 0 8 0 5 1 2 7 1 DRO 4 3 0 0 7 0 3 4 4 3 O-E 4 3 2 5 0 7 0 0 5 2 CAD 3 4 3 1 3 0 7 0 DIV 2 4 0 0 6 3 3 ACT 7 8 4 7 4 5 7 3 15 0 INA 2 3 1 1 3 2 0 3 0 5
Propriétés du tableau de BURT Ø Les valeurs propres de l’AFC du tableau de BURT sont les carrés des valeurs propres de l’AFC du tableau disjonctif complet (TDC). Ø Les composantes principales des modalités sont celles du TDC multipliées par la racine carrée de la valeur propre correspondante dans l’AFC du TDC.
Propriétés des individus Les individus n’apparaissent pas dans cette méthode mais on peut les faire apparaître en éléments supplémentaires. Ø Les composantes principales des individus sont les mêmes que dans l’AFC du TDC. Ø Les points modalités sont les isobarycentres des points individus vérifiant la modalité.
- Des des des
- Définition de l'analyse des pratiques professionnelles
- Identification des dangers
- Des baches wiegenlied analyse
- Les soins infirmiers selon virginia henderson
- Zwei männer in betrachtung des mondes analyse
- Manon des sources analyse
- La famille des cochons ramenée dans l'étable analyse
- Coso2
- Définition de l'analyse des pratiques professionnelles
- Analyse des dangers
- Guernica histoire des arts
- La diffusion des idées des lumières
- Volume des liquides et des solides
- Robin des bois des alpes
- Il existe des personnes qui sont des lumières pour tous
- Volume correspondant à une division
- Double des in cryptography
- Affiche plan marshall
- Les modes et leurs valeurs
- Cartographie des risques gestion des stocks
- Budget des ventes
- Diversification des espaces et des acteurs de la production
- Je t'offrirai des fleurs et des nappes en couleurs
- Multiples of 101
- Inteligencias multiples naturalista ejemplos
- Damodaran multiples
- Multiples of 6 and 8
- Justified forward p/e
- Ben exercises every 12 days
- Integrales triples
- Hemicigotos
- Relative valuation damodaran
- Metric system prefixes chart
- Ley de las proporciones reciprocas ejercicios resueltos