Metodi Quantitativi per Economia Finanza e Management Lezione

  • Slides: 43
Download presentation
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 6

Metodi Quantitativi per Economia, Finanza e Management Lezione n° 6

Statistica descrittiva bivariata Indaga la relazione tra due variabili misurate. Si distingue rispetto alla

Statistica descrittiva bivariata Indaga la relazione tra due variabili misurate. Si distingue rispetto alla tipologia delle variabili indagate: • var. qualitative/quantitative discrete: tavole di contingenza (o a doppia entrata) • var. quantitative: analisi di correlazione lineare • una var. qualitativa e una quantitativa: confronto tra le medie

Confronto tra le medie Se si vuole incrociare una variabile quantitativa con una variabile

Confronto tra le medie Se si vuole incrociare una variabile quantitativa con una variabile qualitativa, la loro relazione può essere descritta confrontando le medie della variabile numerica all’interno delle categorie definite dalla variabile misurata a livello nominale/ordinale. Rapidità Tipo cliente Media N Persone fisiche 7. 8403 357 Aziende 8. 5132 76 Totale 7. 9584 433

Confronto tra le medie Un indice sintetico dell’intensità della relazione si basa sulla scomposizione

Confronto tra le medie Un indice sintetico dell’intensità della relazione si basa sulla scomposizione della varianza per la variabile quantitativa Y, di cui viene studiata la dipendenza nei confronti della variabile categorica X. La variabilità totale di Y è SQTy=SQtra + SQnei dove SQTy (somma dei quadrati tot) è la variabilità tot, SQtra (somma dei quadr. tra i gruppi) esprime quanta variabilità di Y può essere legata al variare delle categorie di X, SQnei (somma dei quadr. nei gruppi) esprime la variabilità nell’andamento di Y indipendente da X.

Confronto tra le medie

Confronto tra le medie

Ricerca di mercato “I biscotti”

Ricerca di mercato “I biscotti”

Agenda n n n Obiettivi della ricerca Descrizione del database Questionario di rilevazione Statistica

Agenda n n n Obiettivi della ricerca Descrizione del database Questionario di rilevazione Statistica descrittiva univariata Segmentazione a posteriori per omogeneità q Modalità classica • • q Analisi Fattoriale Cluster Analysis Modalità flessibile § § n n Conjoint Analysis Cluster Analysis Analisi Discriminante Lineare Conclusioni Il CD allegato contiene tutte le elaborazioni effettuate per la realizzazione della ricerca

Obiettivi della ricerca n Indagine del comportamento dei consumatori in merito all’acquisto e al

Obiettivi della ricerca n Indagine del comportamento dei consumatori in merito all’acquisto e al consumo di biscotti tramite l’applicazione di opportune tecniche di analisi statistica n Individuazione di possibili azioni manageriali da parte delle aziende produttrici di biscotti

Descrizione del database n n n Il database “DB Biscotti” contiene dati relativi ad

Descrizione del database n n n Il database “DB Biscotti” contiene dati relativi ad una indagine di mercato realizzata nell’anno 2005 (nel corso del mese di Aprile) relativamente all’acquisto e al consumo di biscotti Si tratta di interviste personali realizzate a persone con età maggiore di 18 anni Il numero di interviste realizzate sono in totale 221 Il database contiene 2 tipologie di variabili: q Qualitative q Quantitative Le prime (sesso, età, dove acquista abitualmente i biscotti, etc. . ) sono state ricodificate e trasformate da stringhe a numeriche

Questionario di rilevazione 1. Informazioni sulle abitudini di consumo/acquisto In questa fase vengono rilevate

Questionario di rilevazione 1. Informazioni sulle abitudini di consumo/acquisto In questa fase vengono rilevate le abitudini di acquisto dell’intervistato in relazione a: - occasione in cui consuma biscotti luogo in cui consuma biscotti chi acquista biscotti in famiglia dove acquista biscotti con quale frequenza acquista biscotti 2. Valutazione degli attributi rilevanti nell’atto di acquisto dei biscotti Si tratta di 20 attributi caratterizzanti la categoria di riferimento su cui ogni intervistato ha espresso un giudizio di importanza nel momento della scelta del prodotto, su una scala da 1 a 9 (1= gradimento minimo, 9= gradimento massimo) 3. Esplicitazione dell’insieme evocato E’ stato chiesto ad ogni intervistato di citare liberamente 3 marche di biscotti 4. Valutazione della soddisfazione dell’ultima marca di biscotti acquistata Sui medesimi 20 attributi ed in riferimento all’ultima marca acquistata il campione ha espresso una valutazione del grado di soddisfazione su una scala da 1 a 9 (1= gradimento minimo, 9= gradimento massimo)

Questionario di rilevazione 5. Informazioni extra sul comportamento del consumatore n n n 6.

Questionario di rilevazione 5. Informazioni extra sul comportamento del consumatore n n n 6. Marca preferita Grado di coinvolgimento nell’acquisto Attenzione al messaggio pubblicitario Informazioni socio-demografiche In questa fase vengono rilevate le informazioni socio-demografiche dell’intervistato n n n Sesso Età Status familiare Professione Titolo di studio

Abitudini di consumo/acquisto Quando consuma abitualmente biscotti E’ stata data la possibilità di fornire

Abitudini di consumo/acquisto Quando consuma abitualmente biscotti E’ stata data la possibilità di fornire al massimo 2 risposte, ma solo il 55% del campione ne ha usufruito Si è compreso che i biscotti vengono consumati prevalentemente per la prima colazione (85, 5% - risp. 1) e nell’arco della giornata, sia come snack a merenda (25, 3% – risp. 2), sia come dessert dopo cena (12, 2% - risp. 2)

Abitudini di consumo/acquisto Dove consuma abitualmente biscotti Anche per questa domanda erano consentite al

Abitudini di consumo/acquisto Dove consuma abitualmente biscotti Anche per questa domanda erano consentite al massimo 2 risposte, ma solo il 38. 9% degli intervistati le ha fornite entrambe Per il 96. 4% (risp. 1) del campione il luogo preferito dove consumare biscotti è la casa Si evidenzia una sostanziale omogeneità in merito alle altre opzioni di risposta

Abitudini di consumo/acquisto Chi acquista biscotti in famiglia Con quale frequenza acquista biscotti Si

Abitudini di consumo/acquisto Chi acquista biscotti in famiglia Con quale frequenza acquista biscotti Si osserva che nella maggioranza dei casi (64. 3%) i biscotti vengono acquistati direttamente dal consumatore o da un parente stretto genitore (21. 7%) coniuge (13. 6%) § § Si evidenziano 2 tendenze Acquisto frequente (62, 9% - percentuale cumulata di “Più di una volta a settimana” e “Una volta a settimana”) Acquisto sporadico (37, 1% - percentuale cumulata di “Meno di una volta a settimana” e “Una volta al mese”) § §

Abitudini di consumo/acquisto Dove acquista abitualmente i biscotti Solo il 34, 4% degli intervistati

Abitudini di consumo/acquisto Dove acquista abitualmente i biscotti Solo il 34, 4% degli intervistati ha dato una seconda risposta Come prevedibile, nella grande maggioranza dei casi l’acquisto di biscotti avviene nel supermercato; solo in un secondo momento si sposta dal fornaio e in pasticceria Si sottolinea come le opzioni “bar” e “distributori automatici” siano state selezionate nella sola risp. 2 rispettivamente dal 5% e dal 2, 7% del campione

Insieme evocato n n Prima marca ricordata Seconda marca ricordata Terza marca ricordata 10,

Insieme evocato n n Prima marca ricordata Seconda marca ricordata Terza marca ricordata 10, 4% 9, 5% 6, 3% Mulino Bianco 58, 4% 16, 7% 10% Pavesi 6, 8% 18, 6% 16, 7% Saiwa 9% 14, 9% 16, 7% Appare evidente la netta predominanza di marche industriali, soprattutto Mulino Bianco Galbusera Tale risultato è probabilmente diretta conseguenza della strategia aziendale fortemente focalizzata su pubblicità e comunicazione Mulino Bianco, Pavesi e Saiwa che solitamente preferiscono il canale televisivo hanno ottenuto valori marcatamente più alti rispetto a Galbusera, che

Informazioni extra Marca preferita Oltre la metà del campione ha una marca preferita (57.

Informazioni extra Marca preferita Oltre la metà del campione ha una marca preferita (57. 9%) Si evidenzia un sostanziale apprezzamento della marca preferita tanto che gli intervistati dichiarano di essere intenzionati a continuare ad acquistare tale marca Più discordanti sono le risposte in merito alla disponibilità a pagare un prezzo più alto. Si registra in questo caso un alto valore di Std. Deviation

Informazioni extra Grado di coinvolgimento n n n I consumatori sono mediamente attenti alla

Informazioni extra Grado di coinvolgimento n n n I consumatori sono mediamente attenti alla scelta del prodotto (mean 6, 74) e non scelgono la prima marca che capita (mean 2. 68) Secondo il campione, le marche non propongono prodotti simili (mean 4. 35) Dati i risultati in merito a “Scelgo tra le marche trovo nel punto vendita” si deduce che esistono comportamenti di consumo contrastanti (Std. Deviation 2, 319) q q n Alcuni si adeguano alle marche presenti nel punto vendita Altri non acquistano se non trovano la loro marca preferita In media al consumatore piace provare marche diverse nonostante comportamenti di fedeltà alla marca (ampia Std. Deviation)

Informazioni extra Attenzione al messaggio pubblicitario n La pubblicità non risulta essere un fattore

Informazioni extra Attenzione al messaggio pubblicitario n La pubblicità non risulta essere un fattore determinante nella scelta del biscotto n Si pone una maggiore attenzione al messaggio pubblicitario quale fonte di informazioni utili relativamente al prodotto n Tale risultato è in netta contraddizione con quanto precedentemente esplicitato in merito all’insieme evocato. Si ritiene che l’intervistato non abbia espressamente voluto ammettere di farsi influenzare dalla pubblicità. Si suggerisce a questo punto una ricerca esplorativa di tipo qualitativo

Variabili socio-demografiche Sesso, Età, Status familiare Il campione intervistato è costituito in prevalenza da

Variabili socio-demografiche Sesso, Età, Status familiare Il campione intervistato è costituito in prevalenza da donne (61%) Per quanto riguarda l’età, gli individui sono distribuiti in modo sostanzialmente equilibrato fra le fasce proposte Si evidenzia la presenza di 2 principali gruppi di intervistati I single (più della metà del campione) Le coppie (in prevalenza quelle senza figli) La percentuale di nuclei famigliari allargati è invece residuale § §

Variabili socio-demografiche Professione La percentuale di studenti è molto alta (32. 1% ) ed

Variabili socio-demografiche Professione La percentuale di studenti è molto alta (32. 1% ) ed è coerente con il dato relativo all’età secondo cui i giovani tra i 18 e i 25 rappresentano il 35% del campione La categoria impiegato/a raggiunge una percentuale pari al 27. 2%; ciò dipende dal fatto che il termine racchiude varie tipologie di lavoratori (dall’impiegato di banca al ragioniere, al dipendente della pubblica amministrazione) Le altre professioni sono presenti in modo omogeneo

Variabili socio-demografiche Titolo di studio Il livello culturale è medio-alto. Infatti oltre il 50%

Variabili socio-demografiche Titolo di studio Il livello culturale è medio-alto. Infatti oltre il 50% delle persone intervistate ha conseguito un diploma di scuola media superiore, circa il 30% è laureato, mentre solo il 4% ha ottenuto un master post-laurea Questo risultato è giustificato dal fatto che il 60% degli intervistati è composto da persone tra 18 e 35 anni. Tali individui si sono rivelati facilmente avvicinabili e disponibili alla compilazione del questionario

Il questionario n Questionario_Semplificato. xls

Il questionario n Questionario_Semplificato. xls

Test per lo studio dell’associazione tra variabili n Nella teoria dei test, il ricercatore

Test per lo studio dell’associazione tra variabili n Nella teoria dei test, il ricercatore fornisce ipotesi riguardo la distribuzione della popolazione; tali Ip sono parametriche se riguardano il valore di uno ò più parametri della popolazione conoscendone la distribuzione a meno dei parametri stessi; non parametriche se prescindono dalla conoscenza della distribuzione della popolazione. n Obiettivo dei test: come decidere se accettare o rifiutare un’ipotesi statistica alla luce di un risultato campionario. Esistono due ipotesi: H 0 e H 1, di cui la prima è l’ipotesi nulla, la seconda l’ipotesi alternativa la quale rappresenta, di fatto, l’ipotesi che il ricercatore sta cercando di dimostrare.

Test per lo studio dell’associazione tra variabili n Si può incorrere in due tipologie

Test per lo studio dell’associazione tra variabili n Si può incorrere in due tipologie di errore: Possibili Risultati Verifica di Ipotesi Stato di Natura Decisione Non Rifiutare H 0 H 0 Vera No errore Errore Primo Tipo H 0 Falsa Errore Secondo Tipo No Errore

Test per lo studio dell’associazione tra variabili n Errore di Primo Tipo q Rifiutare

Test per lo studio dell’associazione tra variabili n Errore di Primo Tipo q Rifiutare un’ipotesi nulla vera q Considerato un tipo di errore molto serio La probabilità dell’errore di primo tipo è n Chiamato livello si significatività del test n Fissato a priori dal ricercatore

Test per lo studio dell’associazione tra variabili n Errore di Secondo Tipo q Non

Test per lo studio dell’associazione tra variabili n Errore di Secondo Tipo q Non rifiutare un’ipotesi nulla falsa La probabilità dell’errore di secondo tipo è β

Test per lo studio dell’associazione tra variabili Possibili Risultati Verifica di Ipotesi Stato di

Test per lo studio dell’associazione tra variabili Possibili Risultati Verifica di Ipotesi Stato di Natura Legenda: Risultato (Probabilità) Decisione H 0 Vera Non Rifiutare H 0 No errore (1 - ) Rifiutare H 0 Errore Primo Tipo ( ) H 0 Falsa Errore Secondo Tipo (β) No Errore (1 -β)

Test per lo studio dell’associazione tra variabili § Errore di primo tipo ed errore

Test per lo studio dell’associazione tra variabili § Errore di primo tipo ed errore di secondo tipo non si posso verificare contemporanemente § Errore di primo tipo può occorrere solo se H 0 è vera § Errore di secondo tipo può occorrere solo se H 0 è falsa Se la probabilità dell’errore di primo tipo ( ) , allora la probabilità dell’errore di secondo tipo ( β )

Lettura di un test statistico (1) Esempio: H 0: 1) Ipotesi 2) Statistica test

Lettura di un test statistico (1) Esempio: H 0: 1) Ipotesi 2) Statistica test 3) p-value b 1= b 2 =. . =bk = 0 H 1: bi = 0 Statistica F Rappresenta la probabilità di commettere l’errore di prima specie. Può essere interpretato come la probabilità che H 0 sia “vera” in base al valore osservato della statistica test

Lettura di un test statistico (2) Se p-value piccolo RIFIUTO H 0 Altrimenti ACCETTO

Lettura di un test statistico (2) Se p-value piccolo RIFIUTO H 0 Altrimenti ACCETTO H 0

Test χ² per l’indipendenza statistica Si considera la distribuzione χ², con un numero di

Test χ² per l’indipendenza statistica Si considera la distribuzione χ², con un numero di gradi di libertà pari a (k-1)(h-1), dove k è il numero di righe e h il numero di colonne della tabella di contingenza. Qui: n H 0 : indipendenza statistica tra X e Y n H 1 : dipendenza statistica tra X e Y La regione di rifiuto cade nella coda di destra della distribuzione 0. 2 0. 15 0. 1 0. 05 0 La regione di rifiuto è caratterizzata da valori relativamente elevati di χ²; se il livello di significatività è al 5%, si rifiuta per χ²> χ² 0. 95 Regione di rifiuto 0 1. 1 2. 2 3. 3 4. 4 5. 5 6. 6 7. 7 8. 8 9. 9 11

Test χ² per l’indipendenza statistica

Test χ² per l’indipendenza statistica

Test t per l’indipendenza lineare Questo test verifica l’ipotesi di indipendenza lineare tra due

Test t per l’indipendenza lineare Questo test verifica l’ipotesi di indipendenza lineare tra due variabili, partendo dall’indice di correlazione lineare ρ. Si ha: n H 0: indipendenza lineare tra X e Y (ρpopolaz=0) n H 1: dipendenza lineare tra X e Y (ρpopolaz ≠ 0) La statistica test è distribuita come una t di Student con n-2 gradi di libertà, e tende a crescere all’aumentare dell’ampiezza campionaria t= ρ √(n-2)/ (1 - ρ²)

Test t per l’indipendenza lineare La regione di rifiuto è caratterizzata da valori relativamente

Test t per l’indipendenza lineare La regione di rifiuto è caratterizzata da valori relativamente elevati di t in modulo; se il livello di significatività è al 5%, si rifiuta per |t| >t 0, 975 Regione di rifiuto

Test t per l’indipendenza lineare

Test t per l’indipendenza lineare

Test F per la verifica di ipotesi sulla differenza tra medie Si prende in

Test F per la verifica di ipotesi sulla differenza tra medie Si prende in considerazione la scomposizione della varianza; qui n n H 0: le medie sono tutte uguali tra loro H 1: esistono almeno due medie diverse tra loro La statistica test da utilizzare, sotto l’ipotesi H 0, si distribuisce come una F di Fisher con (c-1, n-1) gradi di libertà. Tende a crescere all’aumentare della varianza tra medie e al diminuire della variabilità interna alle categorie. Cresce inoltre all’aumentare dell’ampiezza campionaria.

Test F per la verifica di ipotesi sulla differenza tra medie La regione di

Test F per la verifica di ipotesi sulla differenza tra medie La regione di rifiuto cade nella coda di destra della distribuzione, cioè è caratterizzata da valori relativamente elevati di F; se il livello di significatività è 5%, si rifiuta per F> F 0, 95 0. 8 0. 7 0. 6 0. 5 0. 4 0. 3 0. 2 Regione di rifiuto 0. 1 0 0 0. 7 1. 4 2. 1 2. 8 3. 5 4. 2 4. 9

Test F per la verifica di ipotesi sulla differenza tra medie

Test F per la verifica di ipotesi sulla differenza tra medie

Univariate Analysis

Univariate Analysis

Bivariate Analysis Objective To describe the relationship between two variables jointly. n qualitative variables:

Bivariate Analysis Objective To describe the relationship between two variables jointly. n qualitative variables: Analysis of Connection n quantitative variables: Analysis of Correlation n mixed variables: Analysis of Variance

Bivariate Analysis

Bivariate Analysis