Metodi Quantitativi per Economia Finanza e Management Lezione

  • Slides: 40
Download presentation
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 8 Analisi Fattoriale: le ipotesi

Metodi Quantitativi per Economia, Finanza e Management Lezione n° 8 Analisi Fattoriale: le ipotesi del modello, il metodo delle component principali, la scelta del numero di fattori e loro interpretazione

Percorsi di Analisi

Percorsi di Analisi

Factor Analysis

Factor Analysis

Factor Analysis

Factor Analysis

Factor Analysis

Factor Analysis

Factor Analysis Nel caso in cui l’informazione disponibile per eseguire un’analisi è distribuita tra

Factor Analysis Nel caso in cui l’informazione disponibile per eseguire un’analisi è distribuita tra molte variabili tra loro correlate: Þ Possono insorgere diversi problem di tipo logico/applicativo. • • Informazione solo apparente; Missunderstanding; Difficoltà nella fase interpretativa dei fenomeni; Robustezza dei risultati; Efficienza delle stime; Gradi di libertà; …. .

Factor Analysis Quando le variabili considerate sono numerose spesso risultano tra loro correlate =>

Factor Analysis Quando le variabili considerate sono numerose spesso risultano tra loro correlate => numerosità e correlazione tra variabili porta a difficoltà di analisi Perché sintetizzare? • Se l’informazione è condivisa tra più variabili correlate tra loro, è ridondante utilizzarle tutte. • La sintesi semplifica le analisi successive ma comporta una perdita di informazione, si deve evitare, di perdere informazioni rilevanti.

Analisi fattoriale Perché sintetizzare mediante l’impiego della tecnica? Se l’informazione è “dispersa” tra più

Analisi fattoriale Perché sintetizzare mediante l’impiego della tecnica? Se l’informazione è “dispersa” tra più variabili correlate tra loro, le singole variabili faticano da sole a spiegare il fenomeno oggetto di studio, mentre combinate tra loro risultano molto più esplicative. Esempio: l’attrattività di una città da cosa è data? Dalle caratteristiche del contesto, dalla struttura demografica della popolazione, dalla qualità della vita, dalla disponibilità di fattori quali capitale, forza lavoro, knowhow, spazi, infrastrutture, ecc. I fattori latenti sono “concetti” che abbiamo in mente ma che non possiamo misurare direttamente.

Factor Analysis

Factor Analysis

Factor Analysis

Factor Analysis

Analisi fattoriale Quando le variabili considerate sono numerose spesso risultano tra loro correlate. Numerosità

Analisi fattoriale Quando le variabili considerate sono numerose spesso risultano tra loro correlate. Numerosità e correlazione tra variabili porta a difficoltà di analisi => ridurre il numero (semplificando l’analisi) evitando, però, di perdere informazioni rilevanti. L’Analisi Fattoriale è una tecnica statistica multivariata per l’analisi delle correlazioni esistenti tra variabili quantitative. A partire da una matrice di dati : X(nxp), con “n” osservazioni e “p” variabili originarie, consente di sintetizzare l’informazione in un set ridotto di variabili trasformate (i fattori latenti).

Analisi fattoriale Le ipotesi del Modello Fattoriale Variabili Quantitative x 1, x 2, .

Analisi fattoriale Le ipotesi del Modello Fattoriale Variabili Quantitative x 1, x 2, . . . , xi, . . xp Info Var xi xi xi = = = i = 1, . . , p k << p Corr (UFi , UFj) = 0 Corr (CFi , CFj) = 0 Corr (CFi , UFj) = 0 Info condivisa + Communality + f(CF 1, . . , CFk) + Info specifica Var specifica UFi CFi = Common Factori UFi = Unique Factori per i ^= j per ogni i, j

Analisi fattoriale Factor Loadings & Factor Score Coefficients xi = li 1 CF 1

Analisi fattoriale Factor Loadings & Factor Score Coefficients xi = li 1 CF 1 + li 2 CF 2 +. . + lik. CFk + UFi li 1, li 2, . . . . , lik factor loadings i = 1, . . , p significato fattori CFj = sj 1 x 1 + sj 2 x 2 +. . . + sjpxp sj 1, sj 2, . . . . , sjp factor score coeff. j = 1, . . . , k << p costruzione fattori

Analisi fattoriale Metodo delle Componenti Principali • I fattori calcolati mediante il metodo delle

Analisi fattoriale Metodo delle Componenti Principali • I fattori calcolati mediante il metodo delle CP sono combinazioni lineari delle variabili originarie CPj = sj 1 x 1 + sj 2 x 2 +. . . + sjpxp • Sono tra loro ortogonali (non correlate) • Complessivamente spiegano la variabilità delle p variabili originarie • Sono elencate in ordine decrescente rispetto alla variabilità spiegata

Analisi fattoriale Metodo delle Componenti Principali Il numero massimo di componenti principali è pari

Analisi fattoriale Metodo delle Componenti Principali Il numero massimo di componenti principali è pari al numero delle variabili originarie (p). La prima componente principale è una combinazione lineare delle p variabili originarie ed è caratterizzata da varianza più elevata, e così via fino all’ultima componente, combinazione sempre delle p variabili originarie, ma a varianza minima. Se la correlazione tra le p variabili è elevata, un numero k<<p (k molto inferiore a p) di componenti principali è sufficiente rappresenta in modo adeguato i dati originari, perché riassume una quota elevata della varianza totale.

Analisi fattoriale I problemi di una analisi di questo tipo sono: a) quante componenti

Analisi fattoriale I problemi di una analisi di questo tipo sono: a) quante componenti considerare b) come interpretarle

Analisi fattoriale Quante componenti considerare? 1. 2. 3. 4. metodo degli autovalori >1 rapporto

Analisi fattoriale Quante componenti considerare? 1. 2. 3. 4. metodo degli autovalori >1 rapporto tra numero di componenti e variabili (circa 1/3) percentuale di varianza spiegata (almeno 60%-70%) lo SCREE PLOT (plot di autovalore vs il numero del fattore) Se il plot mostra un “gomito” è plausibile ipotizzare l’esistenza di una struttura latente, se la forma è quasi rettilinea significa che i fattori sono solo una trasformazione delle variabili manifeste. I fattori rilevanti sono quelli al di sopra del gomito (a discrezione anche quello in corrispondenza del gomito). Se non ci sono fattori predominanti il criterio è inadatto. 5. 6. le comunalità interpretabilità delle componenti e loro rilevanza nella esecuzione dell’analisi successive

Analisi fattoriale Come interpretarle? 1. rotazione delle componenti La rotazione ortogonale nello spazio dei

Analisi fattoriale Come interpretarle? 1. rotazione delle componenti La rotazione ortogonale nello spazio dei fattori non influenza la validità del modello: sfruttiamo questa caratteristica per ottenere dei fattori più facilmente interpretabili. 2. correlazioni tra componenti principali e variabili originarie

Analisi Fattoriale • Sono stati individuati 20 attributi caratterizzanti il prodotto-biscotto • È stato

Analisi Fattoriale • Sono stati individuati 20 attributi caratterizzanti il prodotto-biscotto • È stato chiesto all’intervistato di esprimere un giudizio in merito all’importanza che ogni attributo esercita nell’atto di acquisto 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. Qualità degli ingredienti Genuinità Leggerezza Sapore/Gusto Caratteristiche Nutrizionali Attenzione a Bisogni Specifici Lievitazione Naturale Produzione Artigianale Forma/Stampo Richiamo alla Tradizione Grandezza della Confezione (Peso Netto) Funzionalità della Confezione Estetica della Confezione Scadenza Nome del Biscotto Pubblicità e Comunicazione Promozione e Offerte Speciali Consigli per l’Utilizzo Prezzo Notorietà della Marca

Analisi fattoriale Output R - Correlazione tra variabili quantitative

Analisi fattoriale Output R - Correlazione tra variabili quantitative

Output R - Autovalori e Varianza Totale 1. The ratio between the number of

Output R - Autovalori e Varianza Totale 1. The ratio between the number of components and the variables: One out of Three 20 original variables 6 -7 Factors Extract Method: Principal Component Analysis

Output R - Autovalori e Varianza Totale 2. The percentage of the explained variance:

Output R - Autovalori e Varianza Totale 2. The percentage of the explained variance: between 60%75% is good the higher the better! Extract Method: Principal Component Analysis

Factor Analysis Output R – Scree Plot 3. The scree plot : The point

Factor Analysis Output R – Scree Plot 3. The scree plot : The point at which the scree begins

Output R - Autovalori e Varianza Totale 4. Eigenvalue: Eigenvalues>1 Extract Method: Principal Component

Output R - Autovalori e Varianza Totale 4. Eigenvalue: Eigenvalues>1 Extract Method: Principal Component Analysis

Factor Analysis

Factor Analysis

Analisi Fattoriale

Analisi Fattoriale

Output R - Comunalità 5. Communalities: The quote of explained variability for each input

Output R - Comunalità 5. Communalities: The quote of explained variability for each input variable must be satisfactory In the example the overall explained variability (which represents the mean value) is 0. 61045

Factor Analysis • 6. Interpretation: Component Matrix (factor loadings) – The most relevant output

Factor Analysis • 6. Interpretation: Component Matrix (factor loadings) – The most relevant output of a factorial analysis is the so called “component matrix”, which shows the correlations between the original input variables and the obtained components (factor loadings) – Each variable is associated specifically to the factors (components) with which there is the highest correlation – The interpretation of the each factor has to be guided considering the variables with the highest correlations related to single factor

Output R – Componenti principali, estrazione 6 CP 6. Interpretation: Correlation between Input Vars

Output R – Componenti principali, estrazione 6 CP 6. Interpretation: Correlation between Input Vars & Factors The new Factors must have a meaning based on the correlation structure

Output R – Componenti principali, estrazione 6 CP, Rotazione VARIMAX 6. Interpretation: The correlation

Output R – Componenti principali, estrazione 6 CP, Rotazione VARIMAX 6. Interpretation: The correlation structure between Input Vars & Factors In this case the correlation structure is well defined and the interpretation phase is easier

Factor Analysis Issues of the Factor Analysis are the following: a) How many Factors

Factor Analysis Issues of the Factor Analysis are the following: a) How many Factors (or components) need to be considered 6. The degree of the interpretation of the components and how they affect the next analyses b) How to interpret 1. The correlation between the principal components and the original variables 2. The rotation of the principal components

Factor Analysis • 6. Interpretation: The rotation of factors – There are numerous outputs

Factor Analysis • 6. Interpretation: The rotation of factors – There are numerous outputs of factorial analysis which can be produced through the same input data – These numerous outputs don’t provide interpretation that are remarkably different from one another, as matter of fact they differ only slightly and there areas of ambiguity

Factor Analysis CF*j CFj x 1 x 4 CF*i x 2 CFi x 3

Factor Analysis CF*j CFj x 1 x 4 CF*i x 2 CFi x 3 The coordinates of the graph are the factor loadings Interpretation of the factors

Factor Analysis • 6. Interpretation: The rotation of factors – The Varimax method of

Factor Analysis • 6. Interpretation: The rotation of factors – The Varimax method of rotation, suggested by Kaiser, has the purpose of minimizing the number of variables with high saturations (correlations) for each factor – The Quartimax method attempts to minimize the number of factors tightly correlated to each variable – The Equimax method is a cross between the Varimax and the Quartimax The percentage of the overall variance of the rotated factors doesn’t change, whereas the percentage of the variance explained by each factors shifts

Analisi Fattoriale Before the rotation step

Analisi Fattoriale Before the rotation step

Analisi Fattoriale After the rotation step

Analisi Fattoriale After the rotation step

Output R - Comunalità 5. Communalities: The communalities don’t change after the Rotation Step

Output R - Comunalità 5. Communalities: The communalities don’t change after the Rotation Step

Output R – Componenti principali, estrazione 6 CP, Rotazione VARIMAX 6. Interpretation: The correlation

Output R – Componenti principali, estrazione 6 CP, Rotazione VARIMAX 6. Interpretation: The correlation structure between Input Vars & Factors improves after the rotation step

Factor Analysis • Once an adequate solution is found, it is possible to use

Factor Analysis • Once an adequate solution is found, it is possible to use the obtained factors as new macro variables to consider for further analyses on the phenomenon under investigation, thus replacing the original variables; • Again taking into consideration the example, we may add six new variables into the data file, as follows: – Artigianalità, – Convenienza e Praticità, – Genuinità – Comunicazione – Immagine, – Caratteristiche nutrizionali • They are standardized variables: zero mean and variance equal to one. • They will be the input for further analyses of Dependence or/and Interdependence.

Factor Analysis Indentification of the input variables Standardization P. C. methods first findings Number

Factor Analysis Indentification of the input variables Standardization P. C. methods first findings Number of factors Rotation Interpretation