Statistica descrittiva R Fenaroli Che cos la statistica

  • Slides: 36
Download presentation
Statistica descrittiva R. Fenaroli

Statistica descrittiva R. Fenaroli

Che cos’è la statistica • La statistica è lo studio dei fenomeni collettivi. Si

Che cos’è la statistica • La statistica è lo studio dei fenomeni collettivi. Si occupa di raccogliere, elaborare, interpretare e rappresentare dei dati e di restituire in forma organizzata grandi quantità di informazioni. • La collettività oggetto di studio si chiama popolazione o universo statistico.

Indagine statistica Raccolta dei dati Spoglio dei dati Elaborazione dei dati totale parziale (campione)

Indagine statistica Raccolta dei dati Spoglio dei dati Elaborazione dei dati totale parziale (campione)

Organizzazione dei dati • Tabelle (di frequenza) – Es: Il tempo in febbraio Tempo

Organizzazione dei dati • Tabelle (di frequenza) – Es: Il tempo in febbraio Tempo Numero di giorni Sereno 1 Variabile 2 Nuvoloso 12 Piovoso 13 Modalità Frequenza assoluta

Organizzazione dei dati • Frequenza assoluta: il numero di volte che si è manifestata

Organizzazione dei dati • Frequenza assoluta: il numero di volte che si è manifestata una determinata modalità (es: per quanti giorni in febbraio abbiamo osservato un tempo sereno ? ) • Frequenza relativa: è il rapporto fra la frequenza assoluta e il numero totale dei dati. E’ spesso data in percentuale • Frequenza percentuale: è la frequenza relativa moltiplicata per 100 • Esercizio calcoliamo la frequenza percentuale nel caso visto precedentemente

Organizzazione dei dati Tempo Frequenza assoluta Frequenza relativa Sereno 1 0, 036 Variabile 2

Organizzazione dei dati Tempo Frequenza assoluta Frequenza relativa Sereno 1 0, 036 Variabile 2 0, 072 Nuvoloso 12 0, 428 Piovoso 13 0, 464 Le frequenze relative (o percentuali) sono usate per: • effettuare confronti fra i dati • valutare quanto un dato pesa sul totale

Serie statistica • E’ una tabella che esprime la frequenza con modalità qualitative (colore,

Serie statistica • E’ una tabella che esprime la frequenza con modalità qualitative (colore, nazionalità , studi, …) • Serie temporale (o serie storica) : è la distribuzione nel tempo di un dato fenomeno (es: la produzione di lampadine alogene in Italia negli ultimi 4 anni)

Indagine statistica – serie statistica

Indagine statistica – serie statistica

Organizzazione dei dati • In alcuni casi, dati che variano in modo continuo (es:

Organizzazione dei dati • In alcuni casi, dati che variano in modo continuo (es: peso, altezza, numero di dipendenti, …), vengono raggruppati in intervalli (classi). • Esercizio: numero di aziende nella provincia (calcola la frequenza percentuale) Numero di dipendenti Numero di aziende 1 -15 126 16 -30 45 31 -50 23 51 -100 12 Oltre 100 4 %

Frequenza relativa -soluzione Numero di dipendenti Numero di aziende % 1 -15 126 60

Frequenza relativa -soluzione Numero di dipendenti Numero di aziende % 1 -15 126 60 16 -30 45 21, 4 31 -50 23 11 51 -100 12 5, 7 Oltre 100 4 1, 9

Frequenza cumulata: è la somma della frequenze assolute di una data modalità (riga) con

Frequenza cumulata: è la somma della frequenze assolute di una data modalità (riga) con tutte le frequenza assolte precedenti.

Classi – ampiezza e valore centrale • Le classi hanno una dimensione (o ampiezza),

Classi – ampiezza e valore centrale • Le classi hanno una dimensione (o ampiezza), che è data dalla differenza fra il valore massimo e il valore minimo della classe. • Spesso è utile calcolare il valore centrale della classe (si sommano i due estremi e si divide per 2).

Rappresentazione grafica dei dati

Rappresentazione grafica dei dati

Diagramma a barre (ortogramma)

Diagramma a barre (ortogramma)

Areogramma • • L'areogramma è un tipo di rappresentazione grafica in cui le diverse

Areogramma • • L'areogramma è un tipo di rappresentazione grafica in cui le diverse percentuali dei risultati di un'indagine statistica sono visualizzate da aree proporzionali di una figura geometrica piana o tridimensionale. L'unità di misura utilizzata è, spesso, la percentuale. Questo tipo di rappresentazione è particolarmente adatto per operare confronti fra diverse grandezze, senza necessariamente riferirsi ad un totale. Tipi di areogramma sono: – – Il diagramma a torta il diagramma a tabella, rappresentato da un griglia divisa in settori; i diagrammi a bolle, in cui l'area di ogni cerchio corrisponde alla frequenza. gli istogrammi, in quanto hanno base proporzionale all'ampiezza della classe ed altezza uguale alla densità di frequenza (ossia al rapporto tra frequenza assoluta ed ampiezza della classe), pertanto la loro area è proporzionale alla frequenza che rappresentano. I grafici a barre, come ad esempio i grafici a colonne e a nastri, invece, non sono areogrammi in quanto la frequenza che rappresentano corrisponde alla loro altezza e non all'area.

Areogrammi Grafico ad area Grafico a torta Grafico a bolle

Areogrammi Grafico ad area Grafico a torta Grafico a bolle

Tabelle complesse • Le tabelle finora viste sono «semplici» , in quanto evidenziano un

Tabelle complesse • Le tabelle finora viste sono «semplici» , in quanto evidenziano un solo carattere della popolazione presa in esame (eventualmente suddivise in classi). • Possiamo raccogliere più caratteri di una popolazione in un’unica tabella Nome studente Età Altezza (m) Peso (Kg) Bianchi 15 1, 76 70, 3 Rossi 18 1, 78 72, 5 Verdi 16 1, 74 68, 8 … … …

Tabelle - esercizio A) B) C) D) Sono meno di 11. 000 Sono sicuramente

Tabelle - esercizio A) B) C) D) Sono meno di 11. 000 Sono sicuramente meno di 400 Sono una percentuale compresa fra il 4% e il 18% Sono assenti dalle scuole italiane

Tabelle - esercizio • Completa la seguente tabella (indica la preferenza fra quattro prodotti

Tabelle - esercizio • Completa la seguente tabella (indica la preferenza fra quattro prodotti espressa da un gruppo di intervistati) Prodotto Frequenza percentuale Crema ciok 15 Barretta ciok Frequenza assoluta 500 Cereali ciok 30 Torta ciok 35

Tabelle – esercizio -soluzione Prodotto Frequenza percentuale Frequenza assoluta Crema ciok 15 375 Barretta

Tabelle – esercizio -soluzione Prodotto Frequenza percentuale Frequenza assoluta Crema ciok 15 375 Barretta ciok 20 500 Cereali ciok 30 750 Torta ciok 35 875

Tabelle a doppia entrata • Quando ogni unità statistica viene osservata secondo due modalità,

Tabelle a doppia entrata • Quando ogni unità statistica viene osservata secondo due modalità, possiamo creare una tabella a doppia entrata. • In questo caso, si porta in prima colonna la prima modalità, e in prima riga la seconda modalità. L’intersezione fra righe e colonne rappresenta la frequenza delle unità statistiche hanno contemporaneamente le due modalità

Tabelle a doppia entrata Frequenza marginal Frequenza congiunta Frequenza marginale

Tabelle a doppia entrata Frequenza marginal Frequenza congiunta Frequenza marginale

Distribuzione marginale

Distribuzione marginale

Distribuzione condizionata

Distribuzione condizionata

Media aritmetica

Media aritmetica

Media aritmetica

Media aritmetica

Media aritmetica ponderata Media aritmetica: media ponderata con tutti i pesi uguali a uno

Media aritmetica ponderata Media aritmetica: media ponderata con tutti i pesi uguali a uno

Media aritmetica ponderata in caso di classi • Se calcoliamo la media aritmetica ponderata

Media aritmetica ponderata in caso di classi • Se calcoliamo la media aritmetica ponderata in caso di classi, possiamo assumere come valori x 1 , x 2 , … , xp i valori centrali di ogni classe e come pesi le frequenze.

Media aritmetica - esempio • Calcolare la media aritmetica

Media aritmetica - esempio • Calcolare la media aritmetica

Media aritmetica - Soluzione

Media aritmetica - Soluzione

Media ponderata

Media ponderata

Mediana

Mediana

Moda

Moda

Media geometrica

Media geometrica

Media geometrica • Utile per studiare il variare di un fenomeno nel tempo (es:

Media geometrica • Utile per studiare il variare di un fenomeno nel tempo (es: andamento dei prezzi, tasso di rendimento di capitali, tasso di crescita di componenti di una popolazione)

Media geometrica - esempio

Media geometrica - esempio