LA STATISTICA COSA STUDIA LA STATISTICA La statistica

  • Slides: 37
Download presentation
LA STATISTICA

LA STATISTICA

COSA STUDIA LA STATISTICA? • La statistica è una scienza che studia i fenomeni

COSA STUDIA LA STATISTICA? • La statistica è una scienza che studia i fenomeni collettivi attraverso la raccolta di dati, che vengono analizzati, interpretati e rappresentati infine con un diagramma. • Un fenomeno si dice collettivo se è costituito da un insieme di fenomeni singoli tutti dello stesso tipo. • Ogni singolo fenomeno di cui si compone un fenomeno collettivo prende il nome di unità statistica.

LA POPOLAZIONE • La popolazione statistica è un insieme di elementi che presentano tutti

LA POPOLAZIONE • La popolazione statistica è un insieme di elementi che presentano tutti delle caratteristiche comuni. Può essere: reale o empirica: i suoi elementi possono essere concretamente osservati q virtuale o teorica: i suoi elementi non sono concretamente osservati q

Popolazione statistica

Popolazione statistica

La statistica studia le caratteristiche di una popolazione o di alcuni suoi gruppi

La statistica studia le caratteristiche di una popolazione o di alcuni suoi gruppi

La statistica studia ad esempio cosa piace fare alle persone

La statistica studia ad esempio cosa piace fare alle persone

CARATTERI STATISTICI Una popolazione statistica si può classificare in vari modi in base ai

CARATTERI STATISTICI Una popolazione statistica si può classificare in vari modi in base ai diversi caratteri di singoli elementi I caratteri di una popolazione statistica che sono oggetto di un’indagine statistica possono essere: q qualitativi: se le modalità di un carattere qualitativo sono espresse da aggettivi(colore degli occhi, titolo di studio) q quantitativi: se le modalità sono espresse con dei numeri(peso, altezza)

Qualitativi

Qualitativi

Quantitativi

Quantitativi

MODALITA’ • Uno degli scopi della statistica è lo studio di come si distribuisce

MODALITA’ • Uno degli scopi della statistica è lo studio di come si distribuisce una data popolazione, in relazione a uno o più caratteri. • I caratteri che formano l’oggetto di una rilevazione statistica possono differire per diverse manifestazioni, dette modalità del carattere. Le modalità sono dunque i valori numerici che un carattere può assumere.

FREQUENZA O INTENSITA’ Il dato statistico è il numero che si determina in corrispondenza

FREQUENZA O INTENSITA’ Il dato statistico è il numero che si determina in corrispondenza ad una data modalità del carattere. Esso esprime quante volte si è manifestato quella modalità(frequenza) oppure esprime una misura(intensità)

FREQUENZA ASSOLUTA Si dice frequenza assoluta il numero delle volte in cui la modalità

FREQUENZA ASSOLUTA Si dice frequenza assoluta il numero delle volte in cui la modalità si è manifestata nell’indagine. La somma delle frequenze assolute è uguale al numero dei dati.

FREQUENZA RELATIVA Si dice frequenza relativa di una modalità il rapporto tra la frequenza

FREQUENZA RELATIVA Si dice frequenza relativa di una modalità il rapporto tra la frequenza assoluta di tale modalità e il numero totale dei casi. La somma delle frequenze relative è uguale a 1.

FREQUENZA PERCENTUALE Si dice frequenza percentuale la frequenza relativa per 100; si ottiene moltiplicando

FREQUENZA PERCENTUALE Si dice frequenza percentuale la frequenza relativa per 100; si ottiene moltiplicando la frequenza relativa per 100. La somma delle frequenze percentuali è uguale a 100.

CLASSI DI FREQUENZA Nell’analisi statistica univariata una classe è un intervallo di una modalità

CLASSI DI FREQUENZA Nell’analisi statistica univariata una classe è un intervallo di una modalità di un carattere quantitativo. E’ un insieme compreso tra un valore minimo(estremo inferiore della classe) e un valore massimo(estremo superiore della classe).

FASI DI UNA RICERCA STATISTICA • • Studio del problema e impostazione della ricerca

FASI DI UNA RICERCA STATISTICA • • Studio del problema e impostazione della ricerca statistica Rilevamento, classificazione e tabulazione dei dati statistici Diagrammi e analisi statistica dei dati Conclusioni dell’indagine

RACCOLTA DATI • La raccolta dei dati si effettua mediante intervista cioè mediante richiesta

RACCOLTA DATI • La raccolta dei dati si effettua mediante intervista cioè mediante richiesta di informazioni direttamente agli interessati oppure mediante questionario che può essere a risposta chiusa o aperta. • La raccolta si dice completa se si effettua su tutta la popolazione statistica. • La raccolta si dice a campione se si effettua solo su una parte della popolazione statistica.

ORGANIZZAZIONE DEI DATI • Si dice spoglio dei dati l’operazione che consiste nel contare

ORGANIZZAZIONE DEI DATI • Si dice spoglio dei dati l’operazione che consiste nel contare e ordinare i dati raccolti • Si dice tabulazione dei dati l’organizzazione dei dati in tabelle affinché possano essere letti, analizzati e interpretati agevolmente.

ELABORAZIONE DATI La media è un insieme di indicatori di posizione, anche se a

ELABORAZIONE DATI La media è un insieme di indicatori di posizione, anche se a volte con questo termine si intende la media aritmetica. Le principali medie sono: q la media aritmetica q la media geometrica q la media armonica le quali a loro volta possono essere: q semplici q ponderate

LA MEDIA ARITMETICA SEMPLICE La media aritmetica semplice viene usata per riassumere con un

LA MEDIA ARITMETICA SEMPLICE La media aritmetica semplice viene usata per riassumere con un solo numero un insieme di dati su un fenomeno misurabile. Viene calcolata sommando i diversi valori a disposizione, i quali vengono divisi per il numero complessivo di valori. La formula della media aritmetica semplice per N è:

OSSERVAZIONI • La media aritmetica è il valore che i dati assumerebbero se fossero

OSSERVAZIONI • La media aritmetica è il valore che i dati assumerebbero se fossero tutti uguali tra loro. • La media aritmetica ha il difetto di livellare i dati e quindi non consente di rilevare se fra essi ci sono valori molto differenti. • Per ovviare a tale inconveniente si considera “la media aritmetica ponderata”, in quanto ciascun dato trae un particolare “peso” dalla sua frequenza assoluta.

MEDIA ARITMETICA PONDERATA Nella media aritmetica ponderata i singoli valori prima di essere sommati

MEDIA ARITMETICA PONDERATA Nella media aritmetica ponderata i singoli valori prima di essere sommati vengono moltiplicati con “il peso” a loro assegnato. Il peso di ciascun valore è in genere rappresentato dal numero di volte in cui i valori figurano. La formula è:

MEDIA GEOMETRICA La media geometrica di due o più valori numerici è per definizione

MEDIA GEOMETRICA La media geometrica di due o più valori numerici è per definizione la radice ennesima del prodotto dei valori considerati, con n il numero di valori, ed è un indicatore che fornisce una particolare informazione statistica relativa ai dati assegnati. La formula è:

MEDIA ARMONICA La media armonica è il reciproco della media aritmetica dei reciproci. La

MEDIA ARMONICA La media armonica è il reciproco della media aritmetica dei reciproci. La formula è:

MODA E MEDIANA • Si dice moda di una distribuzione di dati la modalità

MODA E MEDIANA • Si dice moda di una distribuzione di dati la modalità che ha la frequenza maggiore. • Si ricava direttamente dalla tabella di distribuzione delle frequenze. ESEMPIO:

 • Si dice mediana di una distribuzione di dati numerici e ordinati in

• Si dice mediana di una distribuzione di dati numerici e ordinati in modo crescente, il valore centrale della distribuzione. • Se il numero dei dati è pari, la mediana è la media dei due valori centrali. • Se i dati sono distribuiti in classi di frequenza allora si parlerà di classe modale o classe mediana. • La classe modale è quella in cui corrisponde la frequenza massima. • Per calcolare la classe mediana si calcola la metà delle frequenze assolute e si osserva a quale classe appartiene.

INDICI DI VARIABILITA’ In alcune indagini, gli indici di posizione centrale possono essere poco

INDICI DI VARIABILITA’ In alcune indagini, gli indici di posizione centrale possono essere poco significativi o addirittura fuorvianti, perché non tengono conto della variabilità dei dati, cioè quando essi si discostano tra loro e dalla loro media. Tale variabilità può essere misurata calcolando tre valori di sintesi, detti indici di variabilità o di dispersione. Tali indici sono: l’intervallo di variazione, lo scarto medio, lo scarto quadratico medio.

INTERVALLO DI VARIAZIONE Si dice “intervallo di variazione” la differenza tra il dato maggiore

INTERVALLO DI VARIAZIONE Si dice “intervallo di variazione” la differenza tra il dato maggiore e il dato minore. ESEMPIO: 5 -12 -34 -22 -10 -6 -2 -38 -4 L’intervallo di variazione è: 38 -2=36

SCARTO MEDIO • Si dice scarto assoluto dalla media il valore: |x-M|con x dato

SCARTO MEDIO • Si dice scarto assoluto dalla media il valore: |x-M|con x dato qualsiasi e M media aritmetica dei dati • Si dice scarto medio di una distribuzione la media di tutti gli scarti assoluti

SCARTO QUADRATICO MEDIO Si dice scarto quadratico medio o deviazione standard di una distribuzione

SCARTO QUADRATICO MEDIO Si dice scarto quadratico medio o deviazione standard di una distribuzione di dati la radice quadrata della media aritmetica dei quadrati degli scarti assoluti dei singoli dati

VARIANZA La varianza è lo scarto quadratico medio elevato alla seconda VARIANZA=∑*2

VARIANZA La varianza è lo scarto quadratico medio elevato alla seconda VARIANZA=∑*2

RAPPRESENTAZIONE GRAFICA DEI FENOMENI STATISTICI • • • Ortogrammi(o grafici a strisce o a

RAPPRESENTAZIONE GRAFICA DEI FENOMENI STATISTICI • • • Ortogrammi(o grafici a strisce o a colonne) Diagrammi circolari(o areogrammi) Ideogrammi Cartogrammi Istogrammi

ISTOGRAMMA L’istogramma è una rappresentazione grafica di una distribuzione in classi di un carattere

ISTOGRAMMA L’istogramma è una rappresentazione grafica di una distribuzione in classi di un carattere continuo. E’ costituito da rettangoli adiacenti le cui basi sono allineate su un asse orientato e dotato di unità di misura(l’asse ha l’unità di misura del carattere e può tranquillamente essere inteso come l’asse delle ascisse). L’adiacenza dei rettangoli dà conto della continuità del carattere. Ogni rettangolo ha base di lunghezza pari all’ampiezza della corrispondente classe; l’altezza invece è calcolata come densità di frequenza, ovvero essa è pari al rapporto fra la frequenza(assoluta) associata alla classe e l’ampiezza della classe.

AREOGRAMMA L’areogramma è un tipo di rappresentazione grafica in cui le diverse percentuali dei

AREOGRAMMA L’areogramma è un tipo di rappresentazione grafica in cui le diverse percentuali dei risultati di un’indagine statistica sono visualizzate da aree proporzionali di una figura geometrica piana o tridimensionale alle frequenze delle diverse modalità. L’areogramma più diffuso è il “grafico a torta” formato da un cerchio suddiviso in settori, l’ampiezza di ciascun settore rappresenta la frequenza di una modalità.

ORTOGRAMMA L’ortogramma a nastro è un particolare grafico. Si tratta di una variante dell’istogramma,

ORTOGRAMMA L’ortogramma a nastro è un particolare grafico. Si tratta di una variante dell’istogramma, in cui la frequenza assoluta è posizionata nell’asse delle ascisse, mentre le diverse variabili sono associate all’asse delle ordinate e rappresentate quindi come rettangoli a sviluppo orizzontale.

CARTOGRAMMA Il cartogramma è una carta geografica sulla quale vengono rappresentati dei dati statistici,

CARTOGRAMMA Il cartogramma è una carta geografica sulla quale vengono rappresentati dei dati statistici, con colori e simboli diversi a seconda dei valori del fenomeno osservato, relativi al territorio che la cartina rappresenta. I cartogrammi vengono utilizzati per dare una visione immediata del rapporto tra territorio e valori del fenomeno. Infatti è più facile osservare un solo grafico già completo che confrontare e sovrapporre una cartina e un istogramma.