Kwantitatieve kwalitatieve data analyse Rijkswaterstaat Adviesdienst Verkeer en

  • Slides: 47
Download presentation
Kwantitatieve & kwalitatieve data analyse Rijkswaterstaat Adviesdienst Verkeer en Vervoer 1 maart 2007 Meetmodellen:

Kwantitatieve & kwalitatieve data analyse Rijkswaterstaat Adviesdienst Verkeer en Vervoer 1 maart 2007 Meetmodellen: Componenten en factoranalyse Dr. M. Coenders 1

Componenten/factoranalyse • • • Multidimensionele schaaltechniek Uitgangspunt: correlaties tussen manifeste variabelen Op zoek naar

Componenten/factoranalyse • • • Multidimensionele schaaltechniek Uitgangspunt: correlaties tussen manifeste variabelen Op zoek naar achterliggende gemeenschappelijke aspecten: – Latente variabelen – Dimensies, ofwel componenten of factoren Doel: 1. Inzicht in structuur van data 2. Schaalconstructie Datareductie: set variabelen samenvatten door – een beperkt aantal dimensies (en een goede interpretatie vinden voor deze latente eigenschappen), – met weinig informatieverlies 2

2 -dimensionele latente structuur Indicatoren, Manifeste variabelen Latente eigenschap Item 1 Item 2 Item

2 -dimensionele latente structuur Indicatoren, Manifeste variabelen Latente eigenschap Item 1 Item 2 Item 3 Dimensie 1 Item 4 Item 5 Item 6 Item 7 Item 8 Dimensie 2 3

Principe van componenten / factoranalyse C X oorspronkelijke datamatrix A Componentof factormatrix Component- of

Principe van componenten / factoranalyse C X oorspronkelijke datamatrix A Componentof factormatrix Component- of factorscore matrix In matrixalgebra: X = C x AT 4

Extractie van componenten of factoren • Component / factor = lineaire combinatie van de

Extractie van componenten of factoren • Component / factor = lineaire combinatie van de oorspronkelijke variabelen, bijv. • Componenten / factoren zodanig getrokken dat: 1) 1 e component / factor extraheert zoveel mogelijk variantie van de oorspronkelijke variabelen (bevat zoveel mogelijk informatie van de oorspr. variabelen). • 2 e component / factor verklaart zoveel mogelijk van de overgebleven variantie, enzovoort. • Vandaar de term Principale Componenten Analyse of Principale Factor Analyse. 2) Componenten / Factoren staan (in beginfase) 5 loodrecht op elkaar. (orthogonaliteit)

Geometrisch voorbeeld C 1 X oorspronkelijke variabelen C componenten X 2 C 2 X

Geometrisch voorbeeld C 1 X oorspronkelijke variabelen C componenten X 2 C 2 X 1 X 3 C 3 Tacq (1991) p. 255 6

Algebraïsch Componenten analyse Z = (gestandaardiseerde) oorspronkelijke variabele C = component a = componentlading

Algebraïsch Componenten analyse Z = (gestandaardiseerde) oorspronkelijke variabele C = component a = componentlading 7

Stappen in componenten- of factoranalyse 1. 2. 3. 4. 5. 6. 7. 8. Uitgangspunt

Stappen in componenten- of factoranalyse 1. 2. 3. 4. 5. 6. 7. 8. Uitgangspunt is de correlatiematrix van m items Kies een methode (bijv. PCA of PFA) Ga na of factoranalyse een geschikte techniek is Initiële oplossing: extractie van m factoren Extractie van gewenst aantal factoren Rotatie van factoren Benoem de factoren Bereken voor elke respondent een score op elke factor 8

Items ter operationalisering van etnocentrisme (Socon 2000) 9

Items ter operationalisering van etnocentrisme (Socon 2000) 9

Stap 1: Correlatiematrix Niet-homogene correlatiematrix: duidt op 2 dimensies 10

Stap 1: Correlatiematrix Niet-homogene correlatiematrix: duidt op 2 dimensies 10

Stappen in componenten- of factoranalyse 1. 2. 3. 4. 5. 6. 7. 8. Uitgangspunt

Stappen in componenten- of factoranalyse 1. 2. 3. 4. 5. 6. 7. 8. Uitgangspunt is de correlatiematrix van m items Kies een methode (bijv. PCA of PFA) Ga na of factoranalyse een geschikte techniek is Initiële oplossing: extractie van m factoren Extractie van gewenst aantal factoren Rotatie van factoren Benoem de factoren Bereken voor elke respondent een score op elke factor 11

Componenten- en factoranalyse Componentenanalyse z 1 a 11 C 1 z 2 z 3

Componenten- en factoranalyse Componentenanalyse z 1 a 11 C 1 z 2 z 3 C 2 z 4 z 5 a 52 z = gestandaardiseerde variabele C = component a = component- of factorlading Factoranalyse U 1 z 1 U 2 z 2 U 3 z 3 U 4 z 4 U 5 z 5 a 11 F 2 a 52 F = gemeenschappelijke (common) factor U = unieke factor 12

Stap 2: Componenten- of factoranalyse? Principale Componenten Analyse de gehele variantie van alle items

Stap 2: Componenten- of factoranalyse? Principale Componenten Analyse de gehele variantie van alle items kan volledig verklaard worden door de andere variabelen in het model Principale Factor Analyse de variantie van elk item kan niet volledig verklaard worden door de andere variabelen in het model; elk item heeft een uniek deel Assumpties voor U: -U’s onderling ongecorreleerd -U en F ongecorreleerd 13

Stappen in componenten- of factoranalyse 1. 2. 3. 4. 5. 6. 7. 8. Uitgangspunt

Stappen in componenten- of factoranalyse 1. 2. 3. 4. 5. 6. 7. 8. Uitgangspunt is de correlatiematrix van m items Kies een methode (bijv. PCA of PFA) Ga na of factoranalyse een geschikte techniek is Initiële oplossing: extractie van m factoren Extractie van gewenst aantal factoren Rotatie van factoren Benoem de factoren Bereken voor elke respondent een score op elke factor 14

Stap 3: PCA of PFA geschikte techniek? 1. Niet-homogene correlatiematrix 2. Check of multicollineariteit

Stap 3: PCA of PFA geschikte techniek? 1. Niet-homogene correlatiematrix 2. Check of multicollineariteit een probleem kan vormen 3. Check of de samenhang tussen variabelen hoog genoeg is: (correlatiematrix, Bartlett’s test, KMO test, Anti-image correlatiematrix) • Bartlett’s test of sphericity – Nulhypothese: alle correlaties zijn 0 – PCA/PFA geschikt indien H 0 verworpen kan worden, ofwel een significante waarde voor χ² • KMO test – Vergelijkt de correlaties uit de correlatiematrix met de partiële correlaties – PCA/PFA geschikt indien waarde > 0. 50 • Anti-image correlatiematrix – Diagonaal: KMO-waarde per variabele: eis > 0. 50 15 – Buiten-diagonaal: (negatieve) partiële correlaties: eis: zeer klein

Stappen in componenten- of factoranalyse 1. 2. 3. 4. 5. 6. 7. 8. Uitgangspunt

Stappen in componenten- of factoranalyse 1. 2. 3. 4. 5. 6. 7. 8. Uitgangspunt is de correlatiematrix van m items Kies een methode (bijv. PCA of PFA) Ga na of factoranalyse een geschikte techniek is Initiële oplossing: extractie van m factoren Extractie van gewenst aantal factoren Rotatie van factoren Benoem de factoren Bereken voor elke respondent een score op elke factor 16

Stap 4: Initiële oplossing (in PCA) • Aantal getrokken componenten = aantal variabelen •

Stap 4: Initiële oplossing (in PCA) • Aantal getrokken componenten = aantal variabelen • Bij componenten analyse: 100% van de variantie van de oorspronkelijke variabelen verklaard. • Componentmatrix : 17

Componentmatrix Communaliteit (proportie verklaarde variantie van item) Indien componenten ongecorreleerd: Correlatie r tussen component

Componentmatrix Communaliteit (proportie verklaarde variantie van item) Indien componenten ongecorreleerd: Correlatie r tussen component en item Totale verklaarde variantie Eigenwaarde (verklaarde variantie per component) Eigenvalue = 18

Initiële oplossing (in PCA): eigenvalues en communaliteiten Eigenwaarde 1 e component = 3. 382.

Initiële oplossing (in PCA): eigenvalues en communaliteiten Eigenwaarde 1 e component = 3. 382. Deze component extraheert 3. 382 / 9 (x 100%) = 37. 6% van de variantie van de 9 items 19

Stappen in componenten- of factoranalyse 1. 2. 3. 4. 5. 6. 7. 8. Uitgangspunt

Stappen in componenten- of factoranalyse 1. 2. 3. 4. 5. 6. 7. 8. Uitgangspunt is de correlatiematrix van m items Kies een methode (bijv. PCA of PFA) Ga na of factoranalyse een geschikte techniek is Initiële oplossing: extractie van m factoren Extractie van gewenst aantal factoren Rotatie van factoren Benoem de factoren Bereken voor elke respondent een score op elke factor 20

Stap 5: exploratief of confirmatief? • Exploratief: op zoek naar latente structuur. Het aantal

Stap 5: exploratief of confirmatief? • Exploratief: op zoek naar latente structuur. Het aantal dimensies wordt bepaald door de empirisch aanwezige structuur. • Confirmatief: toetsen van veronderstelde latente structuur. Het aantal dimensies wordt door onderzoeker opgelegd – In SPSS: 3 dimensies: /criteria = factors (3) – Voor confirmatieve componenten- of factoranalyse met uitgebreide mogelijkheden, zoals vastleggen welke items bij welke latente variabele behoren: Structurele Modellen (‘Structural Equation Modelling’), bijv. met LISREL computerprogramma. 21

Stap 5: Aantal componenten of factoren • Confirmatief: toetsen van theoretische veronderstelling van aantal

Stap 5: Aantal componenten of factoren • Confirmatief: toetsen van theoretische veronderstelling van aantal (en inhoud van) factoren • Exploratief: – Minimum aantal factoren = 1 (unidimensioneel) – Maximum aantal factoren = aantal items (PCA) of aantal items min 1 (PFA) – Afweging tussen: • Eenvoudige structuur (parsimonious model, zuinig): beperkt aantal factoren • Weinig informatieverlies t. a. v. de oorspronkelijke variabelen 22

Aantal factoren: criteria • Eigenwaarde > 1 (Kaisers criterium): Een factor moet op z’n

Aantal factoren: criteria • Eigenwaarde > 1 (Kaisers criterium): Een factor moet op z’n minst net zo veel informatie bevatten als één oorspronkelijke variabele /criteria mineigen(n) (default n=1) • Knikcriterium en scree-criterium (scree plot) Factoren gerangordend naar eigenwaarde. Let op breuklijn tussen belangrijke en minder belangrijke factoren /plot eigen • Totale verklaarde variantie voldoende hoog • Interpreteerbaarheid van de factoren !!! En controleer of de communaliteit van elk item hoog (≥. 20) 23 genoeg is

Knikcriterium en scree-criterium Knik Scree 24

Knikcriterium en scree-criterium Knik Scree 24

Oplossing met 2 getrokken componentmatrix 25

Oplossing met 2 getrokken componentmatrix 25

Oplossing met 2 getrokken componenten Interpretatie van componenten? Lastig, zowel 1 e als 2

Oplossing met 2 getrokken componenten Interpretatie van componenten? Lastig, zowel 1 e als 2 e component correleert sterk met 4 dezelfde items. 26

Rotatie ‘probleem’: geen unieke oplossing C 2’ Coördinaten V 0649: Op C 1, C

Rotatie ‘probleem’: geen unieke oplossing C 2’ Coördinaten V 0649: Op C 1, C 2 (. 734, -. 246) Communaliteit (proportie verklaarde variantie) =. 60 C 1 Coördinaten V 0649 na roteren: Op C 1’, C 2’ (. 758, . 158) V 0649 Ook nu geldt: communaliteit =. 60 C 1’ 27

Stappen in componenten- of factoranalyse 1. 2. 3. 4. 5. 6. 7. 8. Uitgangspunt

Stappen in componenten- of factoranalyse 1. 2. 3. 4. 5. 6. 7. 8. Uitgangspunt is de correlatiematrix van m items Kies een methode (bijv. PCA of PFA) Ga na of factoranalyse een geschikte techniek is Initiële oplossing: extractie van m factoren Extractie van gewenst aantal factoren Rotatie van factoren Benoem de factoren Bereken voor elke respondent een score op elke factor 28

Stap 6: Roteren • Doel: verhogen interpreteerbaarheid van factoren • Roteren in de richting

Stap 6: Roteren • Doel: verhogen interpreteerbaarheid van factoren • Roteren in de richting van eenvoudige structuur (simple structure) • Twee vormen van rotatie – Orthogonaal: onafhankelijke factoren (loodrecht op elkaar) • Methoden: varimax, quartimax, equamax – Oblique roteren: factoren kunnen met elkaar samenhangen (scheve rotatie) • Methoden: direct oblimin, promax • Kies voor oblique indien – Theoretisch aannemelijk – Empirisch: indien correlatie tussen factoren niet verwaarloosbaar klein is 29

Orthogonale rotatie Initiële eigenwaarden Eigenwaarden na extractie van 2 factoren, orthogonaal geroteerd 30

Orthogonale rotatie Initiële eigenwaarden Eigenwaarden na extractie van 2 factoren, orthogonaal geroteerd 30

Orthogonale componentoplossing componentmatrix 31

Orthogonale componentoplossing componentmatrix 31

Oblique rotatie Bij oblique rotatie: totale verklaarde variantie ≠ som eigenwaarden 32

Oblique rotatie Bij oblique rotatie: totale verklaarde variantie ≠ som eigenwaarden 32

Oblique rotatie: gecorreleerde componenten C 2 a = componentlading r = correlatie item en

Oblique rotatie: gecorreleerde componenten C 2 a = componentlading r = correlatie item en component r 12 X 1 a 12 a 11 r 11 C 1 33

Componentladingen en correlaties • Bij orthogonale (ongecorreleerde) componenten: – componentlading = correlatie item en

Componentladingen en correlaties • Bij orthogonale (ongecorreleerde) componenten: – componentlading = correlatie item en component – De componentmatrix bevat deze componentladingen (of correlaties) • Bij gecorreleerde componenten (oblique rotatie) – componentlading ≠ correlatie item en component – De component patroonmatrix bevat de componentladingen – De component structuurmatrix bevat de correlaties 34

Oblique componentoplossing Patroonmatrix 35

Oblique componentoplossing Patroonmatrix 35

Oblique componentoplossing Structuurmatrix: correlatie tussen item en component C 2 α α = Hoek

Oblique componentoplossing Structuurmatrix: correlatie tussen item en component C 2 α α = Hoek tussen C 1 en C 2 r = cosinus(α) r =. 316, α =. 710 C 1 Correlaties tussen componenten 36

Stappen in componenten- of factoranalyse 1. 2. 3. 4. 5. 6. 7. 8. Uitgangspunt

Stappen in componenten- of factoranalyse 1. 2. 3. 4. 5. 6. 7. 8. Uitgangspunt is de correlatiematrix van m items Kies een methode (bijv. PCA of PFA) Ga na of factoranalyse een geschikte techniek is Initiële oplossing: extractie van m factoren Extractie van gewenst aantal factoren Rotatie van factoren Benoem de factoren Bereken voor elke respondent een score op elke factor 37

Stap 7: Interpreteren van componenten • Na rotatie • Kijk naar de matrix met

Stap 7: Interpreteren van componenten • Na rotatie • Kijk naar de matrix met ladingen: – Orthogonale rotatie: componentmatrix – Oblique rotatie: component patroon matrix • Bepaal voor elke component welke variabelen hoog laden en geef op basis van deze variabelen een label aan de component 38

Output factoranalyse • Vergelijk de output op de volgende 3 pagina’s met de eerder

Output factoranalyse • Vergelijk de output op de volgende 3 pagina’s met de eerder vermelde output van componentenanalyse 39

Factoranalyse: h² en eigenwaarden 40

Factoranalyse: h² en eigenwaarden 40

Factoranalyse: ongeroteerde oplossing ∑r²rij =. 506 ∑r²kolom = Factormatrix bevat de r²’s. Sommeren per

Factoranalyse: ongeroteerde oplossing ∑r²rij =. 506 ∑r²kolom = Factormatrix bevat de r²’s. Sommeren per kolom: ∑r² = eigenwaarde 2. 871 + 1. 055 = 3. 926 Omdat factoren ongecorreleerd zijn: Sommeren per rij ∑ r² = h², bijv. (. 683)² + (-. 199)² =. 506 41

Factoranalyse: oblique rotatie ∑r²rij= (. 71)² + (. 33)² =. 61 ≠. 506 (h²)

Factoranalyse: oblique rotatie ∑r²rij= (. 71)² + (. 33)² =. 61 ≠. 506 (h²) ∑r²kolom = 2. 688 + 1. 924 = 4. 612 ≠ 3. 926 42

Stappen in componenten- of factoranalyse 1. 2. 3. 4. 5. 6. 7. 8. Uitgangspunt

Stappen in componenten- of factoranalyse 1. 2. 3. 4. 5. 6. 7. 8. Uitgangspunt is de correlatiematrix van m items Kies een methode (bijv. PCA of PFA) Ga na of factoranalyse een geschikte techniek is Initiële oplossing: extractie van m factoren Extractie van gewenst aantal factoren Rotatie van factoren Benoem de factoren Bereken voor elke respondent een score op elke factor 43

Stap 8: Berekenen van factorscores (of componentscores) Factor/componentscore = lineaire gewogen combinatie van de

Stap 8: Berekenen van factorscores (of componentscores) Factor/componentscore = lineaire gewogen combinatie van de (gestandaardiseerde) oorspronkelijke variabelen Fjk = factorscore van respondent k op factor j Zik = gestandaardiseerde score van respondent k op variabele i Wji = factorscore coëfficiënt voor variabele i en factor j − In Componentenanalyse worden exacte componentscores berekend. − In Factoranalyse worden factorscores geschat 44

Berekenen van factorscores Factorscore 1 =. 220 x V 0649 Z +. 223 x

Berekenen van factorscores Factorscore 1 =. 220 x V 0649 Z +. 223 x V 0650 Z +. 339 x V 0651 Z +. 173 x V 0654 Z +. 197 x V 0655 Z +. 024 x V 0657 Z +. 017 x V 0658 Z +. 038 x V 0663 Z + -. 005 x V 0665 Z - Component en factorscores zijn relatieve scores - Bij Factoranalyse worden factorscores geschat: 45

Factorscore en Likertsomscore • Factorscore = lineaire gewogen combinatie van de (gestand. ) oors

Factorscore en Likertsomscore • Factorscore = lineaire gewogen combinatie van de (gestand. ) oors 46

Verschillen Factorscore en Likertsomscore • Likertsomscore = lineair ongewogen combinatie van de oorspronkelijk –

Verschillen Factorscore en Likertsomscore • Likertsomscore = lineair ongewogen combinatie van de oorspronkelijk – SS 1 = somscore van de 5 items die bij de 1 e factor horen – SS 2 = somscore van de 4 items die bij de 2 e factor horen • Likertsomscore soms gebruikt als benadering van factorscore – Voordeel: Likertsomscores zijn absolute scores, Factorscores zijn rel – Vaak hoge correlaties tussen factorscore en likertsomscore. • correlatie (F 1, SS 1) =. 995; correlatie (F 2, SS 2) =. 905 • Werkwijze indien je Likertsomscores als schaalscores wilt gebruiken: – Eerst met pca/pfa aantonen welke dimensies er zijn – Dan per dimensie somscore van de belangrijke variabelen op die dim 47