Analisi multivariata Lanalisi fattoriale Prof Enrico Ivaldi Analisi

  • Slides: 68
Download presentation
Analisi multivariata L’analisi fattoriale Prof. Enrico Ivaldi

Analisi multivariata L’analisi fattoriale Prof. Enrico Ivaldi

Analisi monovariata Tavole di frequenza numero di persone o casi in ogni categoria spesso

Analisi monovariata Tavole di frequenza numero di persone o casi in ogni categoria spesso espresse come percentuale del campione intervalli/rapporti devono essere raggruppati Diagrammi a barre o istogrammi torte Dipartimento di Scienze Politiche

Analisi monovariata Dipartimento di Scienze Politiche

Analisi monovariata Dipartimento di Scienze Politiche

Analisi monovariata Dipartimento di Scienze Politiche

Analisi monovariata Dipartimento di Scienze Politiche

Analisi bivariata Dipartimento di Scienze Politiche

Analisi bivariata Dipartimento di Scienze Politiche

Analisi monovariata Dipartimento di Scienze Politiche

Analisi monovariata Dipartimento di Scienze Politiche

Analisi monovariata Dipartimento di Scienze Politiche

Analisi monovariata Dipartimento di Scienze Politiche

La correlazione Esprime la relazione tra due variabili, consentendo una valutazione sull’entità del legame

La correlazione Esprime la relazione tra due variabili, consentendo una valutazione sull’entità del legame tra esse, ovvero il loro grado di indipendenza. E’ la misura del grado di concordanza tra due serie di valori. Il coefficiente di correlazione, in particolare, esprime la relazione tra due variabili, che può essere positiva (all’aumentare della variabile A aumenta la variabile B, negativa (all’aumentare di A diminuisce B) oppure uguale a 0 (non vi è relazione tra le due variabili). Coefficiente di correlazione: esprime una misura dell’associazione lineare tra due variabili ed è indicato da una r. I valori che può assumere sono tutti quelli compresi tra -1 e +1. Il valore assoluto del coefficiente di correlazione indica l’intensità della relazione (0= nessuna relazione, 1=relazione lineare perfetta), mentre il segno indica la direzione della relazione. Valori di r vicini a +1 indicano che le variabili hanno una forte relazione positiva, vicino a 0 che hanno poca relazione e vicini a -1 indicano una forte relazione negativa. Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi Multivariata Quella parte della statistica in cui l'oggetto dell'analisi è per sua natura

Analisi Multivariata Quella parte della statistica in cui l'oggetto dell'analisi è per sua natura formato da almeno due componenti Fanno parte della statistica multivariata metodi quali: analisi di regressione multidimensionale analisi dei cluster analisi fattoriale analisi della correlazione canonica e analisi delle componenti principali, analisi delle corrispondenze • analisi discriminante • • Dipartimento di Scienze Politiche

La regressione lineare multipla Dipartimento di Scienze Politiche

La regressione lineare multipla Dipartimento di Scienze Politiche

La regressione lineare multipla Dipartimento di Scienze Politiche

La regressione lineare multipla Dipartimento di Scienze Politiche

La regressione lineare multipla Dipartimento di Scienze Politiche

La regressione lineare multipla Dipartimento di Scienze Politiche

Cluster analysis Il clustering o analisi dei gruppi (dal termine inglese cluster analysis introdotto

Cluster analysis Il clustering o analisi dei gruppi (dal termine inglese cluster analysis introdotto da Robert Tryon nel 1939) è un insieme di tecniche di analisi multivariata dei dati volte alla selezione e raggruppamento di elementi omogenei in un insieme di dati. Le tecniche di clustering si basano su misure relative alla somiglianza tra gli elementi. In molti approcci questa similarità, o meglio, dissimilarità, è concepita in termini di distanza in uno spazio multidimensionale. La bontà delle analisi ottenute dagli algoritmi di clustering dipende molto dalla scelta della metrica, e quindi da come è calcolata la distanza. Gli algoritmi di clustering raggruppano gli elementi sulla base della loro distanza reciproca, e quindi l'appartenenza o meno ad un insieme dipende da quanto l'elemento preso in esame è distante dall'insieme stesso. Dipartimento di Scienze Politiche

Cluster analysis Le tecniche di clustering si possono basare principalmente su due "filosofie": Dal

Cluster analysis Le tecniche di clustering si possono basare principalmente su due "filosofie": Dal basso verso l'alto (metodi aggregativi o bottom-up): Questa filosofia prevede che inizialmente tutti gli elementi siano considerati cluster a sé, e poi l'algoritmo provvede ad unire i cluster più vicini. L'algoritmo continua ad unire elementi al cluster fino ad ottenere un numero prefissato di cluster, oppure fino a che la distanza minima tra i cluster non supera un certo valore, o ancora in relazione ad un determinato criterio statistico prefissato. Dall'alto verso il basso (metodi divisivi o top-down): All'inizio tutti gli elementi sono un unico cluster, e poi l'algoritmo inizia a dividere il cluster in tanti cluster di dimensioni inferiori. Il criterio che guida la divisione è naturalmente quello di ottenere gruppi sempre più omogenei. L'algoritmo procede fino a che non viene soddisfatta una regola di arresto generalmente legata al raggiungimento di un numero prefissato di cluster. Dipartimento di Scienze Politiche

Analisi Fattoriale La sua ‘doppia’ invenzione si può collocare all’inizio del Novecento: - in

Analisi Fattoriale La sua ‘doppia’ invenzione si può collocare all’inizio del Novecento: - in ambito statistico il punto di riferimento principale per l’analisi fattoriale (e per altre tecniche affini) è un articolo del 1901 di Karl Pearson, in cui si fa uso di strumenti di analisi matematica a quel tempo già consolidati, come la distribuzione normale multivariata di Bravais e la teoria degli autovalori e autovettori delle trasformazioni lineari; - - parallelamente, essa venne proposta in ambito psicometrico da Charles Spearman e da alcuni suoi collaboratori per misurare l’intelligenza negli esseri umani (qui la datazione è più incerta, ma si può collocare tra il 1904 e il decennio successivo). Dipartimento di Scienze Politiche

Analisi fattoriale L'analisi fattoriale è una tecnica che permette di evidenziare l'esistenza di una

Analisi fattoriale L'analisi fattoriale è una tecnica che permette di evidenziare l'esistenza di una struttura di tratti latenti o fattori o dimensioni, non misurabili direttamente, all'interno di un insieme di variabili direttamente osservabili (talvolta definite anche variabili indicatore o variabili strumentali) che si relazionino con tali tratti latenti. Al loro interno, le dimensioni sono caratterizzate da una propria coerenza teorica, ossia i fattori non si limitano a rappresentare l'esistenza di un'associazione statistica tra variabili ma devono anche essere interpretabili dal punto di vista scientifico-razionale. Dipartimento di Scienze Politiche

Analisi Fattoriale l’analisi fattoriale permette di misurare proprietà che non hanno una definizione semplice

Analisi Fattoriale l’analisi fattoriale permette di misurare proprietà che non hanno una definizione semplice e netta sul piano teorico e, conseguentemente, non sono rilevabili sul piano empirico mediante una singola operazione di misurazione. il rapporto tra indicatori empirici e concetto teorico sottostante, che d’ora in avanti qualificheremo come fattore latente, o ‘dimensione’, è stato conseguentemente definito rapporto di indicazione (Marradi, 1980). La loro individuazione ex post caratterizza uno stile di ricerca che definiamo esplorativo, contrapposto a uno stile confermativo, in cui il ricercatore definisce a priori, sulla base della riflessione teorica, la struttura dei legami tra le componenti del modello. Dipartimento di Scienze Politiche

Analisi Fattoriale Obiettivo dell’Analisi Fattoriale è quello di interpretare le covariazioni tra un numero

Analisi Fattoriale Obiettivo dell’Analisi Fattoriale è quello di interpretare le covariazioni tra un numero elevato di variabili osservate empiricamente, le variabili manifeste, come se fossero dovute all’effetto di variabili non direttamente osservabili definite fattori latenti comuni. Il caso più semplice, da cui conviene iniziare, è quello unidimensionale, cioè a un solo fattore latente. Dipartimento di Scienze Politiche

Analisi fattoriale L’analisi fattoriale viene effettuata per studiare, riassumere e semplificare le relazioni in

Analisi fattoriale L’analisi fattoriale viene effettuata per studiare, riassumere e semplificare le relazioni in un insieme di variabili Ciò permette di individuare uno o più fattori o dimensioni latenti (ad esempio un tratto di personalità, un atteggiamento) che si suppone abbiano dato origine alle similarità tra le variabili osservate. Il punto di partenza dell’analisi fattoriale è rappresentato da una matrice che contiene le correlazioni tra le variabili osservate Il punto di arrivo è formato da una matrice che contiene una misura della relazione tra le variabili osservate e i fattori latenti Dipartimento di Scienze Politiche

L’analisi fattoriale Dipartimento di Scienze Politiche

L’analisi fattoriale Dipartimento di Scienze Politiche

Analisi monovariata Variables Factors Not Single-parent household Persons aged 25 -64 with higher secondary

Analisi monovariata Variables Factors Not Single-parent household Persons aged 25 -64 with higher secondary education attainment (%) Social Deprivation Households with access to the Internet at home Gross domestic product (GDP) at current market prices (Purchasing Power Standard per inhabitant) Employment by sex and age from 25 to 64 years Material deprivation Income of households. Balance of primary income, net (uses) Fattore = variabile (costrutto) che non è direttamente osservabile ma deve essere inferito attraverso variabili osservate. Dipartimento di Scienze Politiche

Analisi fattoriale Dipartimento di Scienze Politiche

Analisi fattoriale Dipartimento di Scienze Politiche

Definizione e scopi dell’analisi fattoriale • Attraverso essa è possibile ricondurre un insieme di

Definizione e scopi dell’analisi fattoriale • Attraverso essa è possibile ricondurre un insieme di variabili ad una o più dimensioni comuni alle variabili stesse, il cui numero è inferiore alle variabili originarie. • Indagando la dimensionalità sottostante a un insieme di variabili (item di un questionario) è possibile iniziare a verificare se queste variabili possano essere considerate misure valide per esprimere e valutare specifici costrutti. • Lo scopo è riassumere, semplificando, tutta l’informazione contenuta (varianza) nelle relazioni di un insieme di variabili (matrice di correlazioni) attraverso l’identificazione (estrazione) di un numero ristretto di dimensioni (fattori). • Queste dimensioni possono essere definite latenti, ovvero non direttamente misurabili, ma espressione di dimensioni derivate dalla misura di altre variabili specifiche, direttamente osservabili e misurabili. Dipartimento di Scienze Politiche

I passi da seguire 1) Il primo passo in una Analisi Fattoriale consiste nella

I passi da seguire 1) Il primo passo in una Analisi Fattoriale consiste nella selezione di un insieme di indicatori, per i quali si ipotizza l’esistenza di uno o più fattori latenti comuni sottostanti. 2) Il secondo passo è la costruzione di una matrice contenente misure di concordanza tra tutte le coppie di variabili manifeste. Nell’Analisi Fattoriale Esplorativa, tale matrice contiene frequentemente correlazioni lineari 3) Il terzo passo consiste nel determinare in via induttiva, a partire dai dati contenuti nell’input minimo, il numero K ottimale di fattori latenti comuni, 4) Il quarto passo consiste nella stima dei parametri, ossia dei coefficienti di impatto dei fattori latenti sulle variabili manifeste. Questo passo è detto comunemente estrazione dei fattori. Mediante questi coefficienti si cerca di fornire una interpretazione semantica dei fattori estratti; in altri termini, si tenta di dare ai fattori latenti un nome, un’etichetta, che sintetizzi il contenuto delle variabili manifeste, guardando soprattutto a quelle che presentano i coefficienti più elevati. Dipartimento di Scienze Politiche

I passi da seguire 5) Il quinto passo, detto della rotazione dei fattori, non

I passi da seguire 5) Il quinto passo, detto della rotazione dei fattori, non è obbligatorio. Esso si presenta solo quando i fattori comuni sono almeno due. La rotazione è utile per semplificare l’operazione di interpretazione dei fattori, d cui parlavamo al termine del punto precedente. L’operazione di rotazione si chiama così perché le variabili manifeste possono essere viste come punti-vettore in uno spazio a K dimensioni, dove K è il numero dei fattori. Ciò che viene ruotato sono dunque gli assi di riferimento, cioè proprio i fattori. La rotazione non fa altro che ridefinire in modo più opportuno le coordinate dei vettori che rappresentano le variabili, lasciando inalterata la posizione relativa di tali vettori; tale operazione lascia perciò inalterata la soluzione da un punto di vista globale. 6) L’ultimo passo dell’Analisi Fattoriale come tecnica di analisi multivariata è la valutazione del modello. Si cerca, con l’ausilio di apposite statistiche, descrittive e in alcuni casi inferenziali, di valutare quanto il modello teorico si adatta alla struttura empirica dei dati. Inoltre, facendo ricorso ad alcuni parametri standard rintracciabili nella letteratura, si può valutare la significatività sostanziale dei fattori estratti. Dipartimento di Scienze Politiche

I passi da seguire 7) Spesso, chi fa uso dell’Analisi Fattoriale prosegue con un

I passi da seguire 7) Spesso, chi fa uso dell’Analisi Fattoriale prosegue con un passo supplementare: la stima dei punteggi fattoriali (factor scores). Esso consiste nell’attribuire a ogni caso della matrice Cx. V un punteggio, che rappresenta la posizione su ognuno dei fattori comuni estratti. L’input minimo in questo caso è rappresentato dalla matrice di correlazione e dalla matrice Casi per Variabili. Dipartimento di Scienze Politiche

Terminologia Dipartimento di Scienze Politiche

Terminologia Dipartimento di Scienze Politiche

Analisi fattoriale Dipartimento di Scienze Politiche

Analisi fattoriale Dipartimento di Scienze Politiche

Analisi fattoriale Dipartimento di Scienze Politiche

Analisi fattoriale Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS In caso di rotazione obliqua le relazioni tra variabili e

Analisi fattoriale con SPSS In caso di rotazione obliqua le relazioni tra variabili e fattori sono riassunte attraverso due matrici: la Matrice Struttura e la Matrice Pattern. La prima contiene dei coefficienti di regressione (beta) che rappresentano il contributo unico di ciascun fattore alla spiegazione della varianza della variabile, essa risente quindi della correlazioni tra fattori. L’interpretazione dei fattori andrà fatta sulla matrice Pattern. Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Lettura e interpretazione dell’Output: la varianza spiegata Dipartimento di Scienze Politiche

Lettura e interpretazione dell’Output: la varianza spiegata Dipartimento di Scienze Politiche

Lo scree-plot Dipartimento di Scienze Politiche

Lo scree-plot Dipartimento di Scienze Politiche

La matrice delle componenti Dipartimento di Scienze Politiche

La matrice delle componenti Dipartimento di Scienze Politiche

La matrice della componente ruotata: rotazioni ortogonali Dipartimento di Scienze Politiche

La matrice della componente ruotata: rotazioni ortogonali Dipartimento di Scienze Politiche

La matrice della componente ruotata: rotazioni oblique Dipartimento di Scienze Politiche

La matrice della componente ruotata: rotazioni oblique Dipartimento di Scienze Politiche

Lettura e interpretazioni dell’output: le saturazioni Dipartimento di Scienze Politiche

Lettura e interpretazioni dell’output: le saturazioni Dipartimento di Scienze Politiche

Un esempio di interpretazione Dipartimento di Scienze Politiche

Un esempio di interpretazione Dipartimento di Scienze Politiche

Un esempio di interpretazione Dipartimento di Scienze Politiche

Un esempio di interpretazione Dipartimento di Scienze Politiche

Un esempio di interpretazione Dipartimento di Scienze Politiche

Un esempio di interpretazione Dipartimento di Scienze Politiche

Un esempio di interpretazione con due fattori estratti Dipartimento di Scienze Politiche

Un esempio di interpretazione con due fattori estratti Dipartimento di Scienze Politiche

Tabella delle comunalità Dipartimento di Scienze Politiche

Tabella delle comunalità Dipartimento di Scienze Politiche

Problemi nell’interpretazione degli Output Dipartimento di Scienze Politiche

Problemi nell’interpretazione degli Output Dipartimento di Scienze Politiche

I passi da effettuare Dipartimento di Scienze Politiche

I passi da effettuare Dipartimento di Scienze Politiche

Un secondo esempio Dipartimento di Scienze Politiche

Un secondo esempio Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Un ultimo esempio Dipartimento di Scienze Politiche

Un ultimo esempio Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche

Analisi fattoriale con SPSS Dipartimento di Scienze Politiche