ANALISI FATTORIALE Cos lanalisi fattoriale Statistica confermativa vs

  • Slides: 30
Download presentation
ANALISI FATTORIALE

ANALISI FATTORIALE

Cos’è l’analisi fattoriale? Statistica confermativa vs Statistica descrittiva Confermare, dimostrare un’ipotesi di partenza. Rappresentazione

Cos’è l’analisi fattoriale? Statistica confermativa vs Statistica descrittiva Confermare, dimostrare un’ipotesi di partenza. Rappresentazione delle variabili in studio. - H di partenza Aumentare la quantità di informazioni relative ai dati raccolti ed alle variabili considerate. - Variabili dipendenti - Fattori - Strumenti di raccolta dati - Analisi dei dati - Eventuale falsificazione dell’H 0 Rappresentazione più efficace ed utile possibile dei dati. Semplificazione dei dati per migliorare la loro interpretazione.

Cos’è l’analisi fattoriale? Nasce in ambito medico-psicologico. Utilizzata soprattutto per validare i questionari perché

Cos’è l’analisi fattoriale? Nasce in ambito medico-psicologico. Utilizzata soprattutto per validare i questionari perché fornisce informazioni relative alla struttura dei dati. E’ una procedura matematica. Spesso viene sovrastimata da molti autori. Non ci permette di arrivare alla conferma di un’H di partenza ma è una tecnica vantaggiosa, per questo ampiamente usata, che ci fornisce informazioni difficili da ottenere in altro modo.

Come lavora l’Analisi Fattoriale Variabili di partenza Quantitative, gaussiane, correlate fra loro che vengono

Come lavora l’Analisi Fattoriale Variabili di partenza Quantitative, gaussiane, correlate fra loro che vengono analizzate allo stesso livello. Operazioni matematiche Matrice di correlazione Estrazione di fattori ortogonali Rotazione

Scopi principali 1. Riduzione del numero di variabili in studio (ma non dell’informazione). 2.

Scopi principali 1. Riduzione del numero di variabili in studio (ma non dell’informazione). 2. Trasformazione delle varabili in studio in variabili indipendenti. 3. Individuazione delle sorgenti delle variabili. 4. Assegnazione di significato reale a tali variabili.

Critiche: Trova variabili artificiali, aleatorie, è possibile rintracciarne un numero infinito. Sono indipendenti tra

Critiche: Trova variabili artificiali, aleatorie, è possibile rintracciarne un numero infinito. Sono indipendenti tra loro, per questo non riflettono la realtà psicologica dove è difficile trovare fenomeni non correlati. Ruolo indiscusso: Vantaggi: Validazione di questionari e riduzione del numero di variabili in studio, non correlate tra loro. - Riduzione delle variabili ma non dell’informazione utile. - Creazione di fattori che rappresentano la stessa realtà ma che sono indipendenti fra loro. - Non vengono considerate le differenze fra le diverse variabili.

Standardizzazione dei dati raccolti I punteggi grezzi vengono trasformati in punti z, ovvero vengono

Standardizzazione dei dati raccolti I punteggi grezzi vengono trasformati in punti z, ovvero vengono standardizzati Semplifica i conti. Permette il confronto di punteggi appartenenti a diversi questionari.

Standardizzazione dei dati raccolti Cos’è la varianza? Può essere vista come la quantità d’informazione

Standardizzazione dei dati raccolti Cos’è la varianza? Può essere vista come la quantità d’informazione trasportata da ogni parametro. Maggiore è la variabilità e maggiore è l’informazione. La varianza complessiva risulta ora uguale al numero totale delle variabili considerate.

I OPERAZIONE: Creazione della Matrice di Correlazione La prima matrice di correlazione estratta dall’analisi

I OPERAZIONE: Creazione della Matrice di Correlazione La prima matrice di correlazione estratta dall’analisi è la matrice di correlazione R. Mostra tutte le relazioni possibili tra le variabili. Le variabili vengono correlate a due. Due variabili sono statisticamente correlate fra loro quando al variare di una anche l’altra varia. Avremo un numero di nuove variabili, fattori, corrispondente al numero delle variabili iniziali, item. Avremo una varianza complessiva uguale al numero delle variabili iniziali, perché ogni item ha varianza 1 e media 0.

II OPERAZIONE: Estrazione dei Fattori Metodi di estrazione: - Metodo delle componenti principali -

II OPERAZIONE: Estrazione dei Fattori Metodi di estrazione: - Metodo delle componenti principali - Metodo della massima verosimiglianza - Metodo dei minimi quadrati - ….

Metodo delle componenti principali Tale metodo permette di creare variabili artificiali, dette fattori, fra

Metodo delle componenti principali Tale metodo permette di creare variabili artificiali, dette fattori, fra loro ortogonali (correlazione = 0). I fattori sono combinazioni lineari delle variabili sperimentali, si ottengono cioè dalla somma dei prodotti delle singole variabili sperimentali, o meglio dei loro valori z, per gli opportuni coefficienti. Il valore e il segno di questi coefficienti indicano quanto e come il singolo fattore sia legato alle diverse variabili sperimentali. I fattori non hanno più varianza = 1 Utilizza un processo a cascata per cui il primo fattore spiega il massimo della varianza, ed è il più importante. Si avvale del calcolo degli AUTOVALORI e degli AUTOVETTORI dalla matrice di correlazione.

Cosa sono gli AUTOVALORI e gli AUTOVETTORI? Vengono calcolati direttamente dalla matrice di correlazione

Cosa sono gli AUTOVALORI e gli AUTOVETTORI? Vengono calcolati direttamente dalla matrice di correlazione R attraverso un processo algebrico. Autovalori = la quantità di varianza di un fattore, la comunalità. Autovettori = sono i fattori o componenti. R x AUTOVETTORE = AUTOVETTORE x AUTOVALORE AUTOVETTORE x R dev’essere uguale a se stesso a meno di una costante che si chiama AUTOVALORE.

Come decidere quanti fattori tenere? 1. Posso decidere un numero preciso da tenere (sottoscale).

Come decidere quanti fattori tenere? 1. Posso decidere un numero preciso da tenere (sottoscale). 2. Posso decidere la percentuale di informazione spiegata che voglio tenere (60 -65%). 3. Tengo solo i fattori con varianza maggiore o uguale ad 1. 4. Guardo lo scree plots.

A cosa mi servono le nuove variabili? - Compattazione dei dati. - Tengo un

A cosa mi servono le nuove variabili? - Compattazione dei dati. - Tengo un numero inferiore di dati, perdo una parte accettabile d’informazione ed ho una interpretazione delle variabili in studio. - Guardo il legame tra fattori e variabili di partenza. - Osservando la matrice per colonna posso indagare quanto i singoli fattori sono correlati alle variabili di partenza. - Osservando la matrice per riga è possibile decidere quali sono gli item da scartare in relazione alla loro correlazione con i fattori (quelli meno correlati).

E’ possibile calcolare il valore ad ogni fattore soggetto per soggetto. Tali punteggi saranno

E’ possibile calcolare il valore ad ogni fattore soggetto per soggetto. Tali punteggi saranno variabili Z con media = 0 e varianza = 1. Punteggio grezzo del soggetto 1 all’item 1 X Coefficiente di correlazione tra item 1 e fattore 1 Faccio la stessa con tutti gli item (1, 2, 3, …), sommo tutti i prodotti ed ottengo il punteggio del soggetto 1 al fattore 1.

Metodo dei minimi quadrati Minimizza la somma dei quadrati degli scarti fra i dati

Metodo dei minimi quadrati Minimizza la somma dei quadrati degli scarti fra i dati osservati e la matrice di correlazione prodotta dal modello.

Metodo della Massima Verosimiglianza Questa tecnica affronta la casualità in termini inversi rispetto alla

Metodo della Massima Verosimiglianza Questa tecnica affronta la casualità in termini inversi rispetto alla probabilità: parte dai dati sperimentali e si chiede che probabilità c’è di avere una distribuzione del fenomeno di un certo tipo. Lavora per approssimazioni successive e stima una matrice di correlazione e un’insieme di varianze che rappresentano i dati sperimentali, eliminando la ridondanza con la minima dispersione d’informazione.

etodo della Massima Verosimiglian Lo scopo principale è quello di rappresentare al meglio la

etodo della Massima Verosimiglian Lo scopo principale è quello di rappresentare al meglio la realtà. L’Analisi Fattoriale è utilizzata per studiare modelli che rappresentino al meglio la realtà, caratterizzati da legami tra item e fattori, in altre parole modelli a variabili artificiali, latenti. La tecnica della Massima Verosimiglianza ci offre la miglior rappresentazione della realtà possibile e ci da anche la misura di quanto bene riesca a rappresentarla!

todo della Massima Verosimiglianz Tale tecnica parte dall’estrazione dei fattori delle Componenti Principali. Vengono

todo della Massima Verosimiglianz Tale tecnica parte dall’estrazione dei fattori delle Componenti Principali. Vengono modificati i fattori per rappresentare al meglio gli item sperimentali. Aumenta e diminuisce la varianza dei fattori e contemporaneamente vengono modificati anche gli altri fattori finchè non trova la combinazione di fattori, varianze, che rappresentano al meglio la realtà.

todo della Massima Verosimiglianz Quando fermarsi? Ogni volta che si fa una modifica viene

todo della Massima Verosimiglianz Quando fermarsi? Ogni volta che si fa una modifica viene applicato il test del Chi 2 per misurare la bontà dell’adattamento dei dati. La significatività indica che la modifica apportata è significativamente migliore rispetto ai fattori delle Componenti Principali (e della modifica precedente). Il valore reale (dati grezzi) è differente dal valore dei fattori (calcolato), così il Chi 2 confronta le due situazioni relative agli stessi dati e ci dice quanto è reale la rappresentazione attuale.

etodo della Massima Verosimiglianz Ottengo anche in questo caso delle variabili ortogonali ma non

etodo della Massima Verosimiglianz Ottengo anche in questo caso delle variabili ortogonali ma non avrò il primo fattore con la maggior quantità d’informazione spiegata e i fattori successivi con varianza mano sempre minore. C’è una distribuzione equa, più simile possibile alla realtà dell’informazione. Per creare fattori non ridondanti non è necessario creare un fattore principale con effetto a cascata sulla quantità di varianza degli altri, anzi la maggior parte dei questionari distribuisce in modo equo l’informazione fra i diversi item. .

Componenti Principali Calcola i fattori attraverso una formula diretta. Offre la miglior condensazione di

Componenti Principali Calcola i fattori attraverso una formula diretta. Offre la miglior condensazione di varianza, con la minima dispersione d’informazione; questo non significa che rappresenta la realtà nel miglior modo. Al variare del numero di fattori da tenere l’ analisi non cambia Massima Verosimiglianza Usa la tecnica delle approssimazioni successive. Trova i fattori che meglio rappresentano la realtà. Non lavora con troppe o troppo poche variabili. Se vario il numero di fattori che sono interessato a tenere devo rifare l’analisi. Maggiore sarà il numero delle variabili di partenza e maggiore sarà la differenza dei risultati delle due analisi.

III Operazione: Rotazione dei fattori Modifica la relazione esistente tra item e fattori attraverso

III Operazione: Rotazione dei fattori Modifica la relazione esistente tra item e fattori attraverso una rotazione dei fattori. Con la rotazione operiamo una combinazione lineare dei fattori di partenza in modo da modificare la loro relazione con gli item. Tali fattori possono rimanere fra loro ortogonali oppure divenire non ortogonali.

III Operazione: Rotazione dei fattori Nasce principalmente da due critiche: 1. Vengono scoperte variabili

III Operazione: Rotazione dei fattori Nasce principalmente da due critiche: 1. Vengono scoperte variabili latenti indipendenti. 2. Vengono dati dei nomi ai fattori. La rotazione rende i fattori maggiormente interpretabili. Una diversa interpretazione dei fattori, e del loro legame con gli item, modifica l’interpretazione e il significato della ricerca!

III Operazione: Rotazione dei fattori La rotazione può essere ORTOGONALE oppure OBLIQUA. Mentre la

III Operazione: Rotazione dei fattori La rotazione può essere ORTOGONALE oppure OBLIQUA. Mentre la rotazione ORTOGONALE mantiene l’indipendenza dei fattori, la rotazione OBLIQUA rende i fattori correlati fra loro. Le rotazioni sono meglio interpretabili attraverso un grafico cartesiano dove gli assi rappresentano i fattori e le coordinate sono date dalle correlazioni della matrice R.

III Operazione: Rotazione dei fattori Con la rotazione ORTOGONALE ruoto rigidamente gli assi cartesiani

III Operazione: Rotazione dei fattori Con la rotazione ORTOGONALE ruoto rigidamente gli assi cartesiani ed essi rimangono ortogonali e la somma totale delle varianze rimane uguale al totale della variabili di partenza. Con la rotazione OBLIQUA gli assi cartesiani non sono più perpendicolari fra loro ma obliqui, quindi non sono più indipendenti ma correlati e la somma totale delle varianze non corrisponderà più al numero totale delle variabili di partenza.

Tecniche di rotazione: Varimax Method. Effettua una rotazione ortogonale che minimizza il numero di

Tecniche di rotazione: Varimax Method. Effettua una rotazione ortogonale che minimizza il numero di variabili che sono fortemente correlate con ogni fattore. Il peso dei fattori è così distribuito più uniformemente e l’interpretazione dei fattori è semplificata. Quartimax Method. Ha un funzionamento opposto a quello della Varimax. Minimizza il numero di fattori necessari a spiegare ciascuna variabile. Semplifica la spiegazione delle variabili osservate.

Tecniche di rotazione: Equamax Method. È una combinazione fra il varimax e il quartimax.

Tecniche di rotazione: Equamax Method. È una combinazione fra il varimax e il quartimax. Oblimin Rotation. Rotazione obliqua che cerca di adattare i fattori agli item e li correla. Promax Rotation. Rotazione obliqua. E’ un metodo più diretto che cerca la rotazione che meglio si adatta a rappresentare i fattori con un singolo item e lo fa direttamente.

Ultima fase: Utilizzo dei punteggi fattoriali per ulteriori analisi Attraverso la correlazione fra i

Ultima fase: Utilizzo dei punteggi fattoriali per ulteriori analisi Attraverso la correlazione fra i punteggi dei fattori calcolati su ciascun caso è possibile verificare la correlazione fra i fattori e le sottoscale.

Grazie per l’attenzione

Grazie per l’attenzione