1 Inferenza Statistica Le componenti teoriche dellInferenza Statistica

  • Slides: 25
Download presentation
1

1

Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria

Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei parametri la teoria della verifica delle ipotesi 2

Probabilità Il concetto di probabilità è espresso di frequente nella pratica quotidiana: un cliente

Probabilità Il concetto di probabilità è espresso di frequente nella pratica quotidiana: un cliente ha la probabilità di stare bene in un albergo a 5 stelle 95 volte su 100, una compagnia aerea 9 volte su 10 è puntuale… etc.

Incertezza e Probabilità Devono rientrare delle navi, come sarà il tempo? esperienza relativa alle

Incertezza e Probabilità Devono rientrare delle navi, come sarà il tempo? esperienza relativa alle • • condizioni del tempo dei giorni precedenti tempo previsto nella stagione considerata previsioni meteo saranno fatte valutazioni probabilistiche per minimizzare possibili errori di previsione Probabilità: l’accadere di un certo evento è più o meno verosimile in relazione ad altri eventi 4

Incertezza e Probabilità Prova: esperimento in cui si riscontra incertezza nel risultato Evento aleatorio:

Incertezza e Probabilità Prova: esperimento in cui si riscontra incertezza nel risultato Evento aleatorio: uno dei possibili risultati di una prova la realizzazione delle prove darà poi luogo ad uno e ad un solo risultato tra i possibili previsti (modalità disgiunte) es. lancio di una moneta, dado, etc. . . al momento in cui l’esperimento è compiuto, il risultato possa essere noto, oppure no al ricercatore Evento certo: si verifica sicuramente Evento impossibile: non può mai realizzarsi 5

Impostazione Assiomatica (Kolmogorov) 1) POSITIVITA’ : P(E)≥ 0 2) CERTEZZA: P(E)=1 se E vento

Impostazione Assiomatica (Kolmogorov) 1) POSITIVITA’ : P(E)≥ 0 2) CERTEZZA: P(E)=1 se E vento certo 3) UNIONE: se A e B sono due eventi incompatibili (mutuamente esclusivi) P(AUB)= P(A)+ P(B) 6

In conclusione: 0 ≤ P(A) ≤ 1 la probabilità del verificarsi di due o

In conclusione: 0 ≤ P(A) ≤ 1 la probabilità del verificarsi di due o più eventi incompatibili è pari alla somma delle singole probabilità 7

APPROCCIO FREQUENTISTA Si consideri il lancio di un dado di caratteristiche ignote e si

APPROCCIO FREQUENTISTA Si consideri il lancio di un dado di caratteristiche ignote e si calcoli la probabilità che si verifichi l’evento (un qualsiasi possibile risultato del lancio): “uscita di una faccia contraddistinta da un numero pari” dall’osservazione del fenomeno risulta che: al ripetersi dei lanci, le facce contraddistinte da numeri pari escono circa la metà delle volte rispetto alle facce dispari e che sempre più, al progressivo ripetersi del numero dei lanci, nell’uscire, tendono a stabilizzarsi sulla metà delle volte allora si può affermare che: al ripetersi dei lanci “sempre sotto le medesime condizioni”, la probabilità (compresa tra 0 e 1) che esca una faccia contraddistinta da un numero pari sarà 0, 50 8

Scuola frequentista L’evento E è un possibile risultato di un esperimento ripetibile n =

Scuola frequentista L’evento E è un possibile risultato di un esperimento ripetibile n = numero di prove effettuate m = numero di eventi che si sono verificati F= frequenza assoluta Al tendere del tempo all’infinito, m/n si stabilizza, esprimendo la probabilità di verificarsi dell’evento 9

Variabile casuale VARIABILE CASUALE X: qualsiasi caratteristica si presenti con modalità diverse x 1,

Variabile casuale VARIABILE CASUALE X: qualsiasi caratteristica si presenti con modalità diverse x 1, x 2, x 3, …, da soggetto o, nello stesso soggetto, da un momento all’altro Modalità: tutti i valori che la variabile può assumere Variabile casuale: quantitativa (continua, discreta) qualitativa (nominale, ordinale) prima di una data prova, può assumere in ciascuna osservazione un valore qualsiasi, dopo la prova, essa assumerà, in ciascuna osservazione, uno ed un solo valore, detto “determinazione della variabile casuale” VARIABILE DETERMINISTICA: variabile casuale dopo una determinata prova. 10

Distribuzione di probabilità I valori possibili (modalità) di una variabile casuale sono riassunti in

Distribuzione di probabilità I valori possibili (modalità) di una variabile casuale sono riassunti in una distribuzione, definita “distribuzione di probabilità” Nella distribuzione di probabilità sono mostrati tutti i possibili valori di una variabile casuale con le rispettive probabilità di verificarsi 11

Distribuzioni di frequenza e distribuzioni di probabilità Una distribuzione di frequenza mostra il risultato

Distribuzioni di frequenza e distribuzioni di probabilità Una distribuzione di frequenza mostra il risultato di ogni evento e la sua relativa frequenza Una distribuzione di probabilità elenca ogni valore possibile con la relativa probabilità 12

Alcune distribuzioni di probabilità n n Variabili discrete Variabili continue v Binomiale v Poisson

Alcune distribuzioni di probabilità n n Variabili discrete Variabili continue v Binomiale v Poisson v Normale Standardizzata v t di Student 13

Distribuzione Binomiale n n n Variabile casuale discreta dicotomica assume 1= successo con probabilità

Distribuzione Binomiale n n n Variabile casuale discreta dicotomica assume 1= successo con probabilità p 0= insuccesso con probabilità q=1 -p uno ed un solo risultato tra i due possibili; la probabilità è la stessa per ogni prova tutte le prove sono indipendenti Funzione di probabilità: 14

Distribuzioni di Poisson p = probabilità che l’evento si verifichi n = numero delle

Distribuzioni di Poisson p = probabilità che l’evento si verifichi n = numero delle prove p < 0, 05 n > 100 Funzione di probabilità Dove λ è il numero medio di eventi per intervallo di tempo 15

Distribuzione Normale Variabile casuale continua Molti dei dati rilevati tendono a distribuirsi secondo le

Distribuzione Normale Variabile casuale continua Molti dei dati rilevati tendono a distribuirsi secondo le caratteristiche della normalità Più numerose saranno le osservazioni sulla variabile, più numerosi saranno i rettangoli componenti l’istogramma più il grafico si approssimerà ad una curva a campana 16

Distribuzione Normale standardizzata Funzione di densità 17

Distribuzione Normale standardizzata Funzione di densità 17

Probelma: Ø Distribuzioni Probabilità del verificarsi di un evento Ø L’evento segue una distribuzione

Probelma: Ø Distribuzioni Probabilità del verificarsi di un evento Ø L’evento segue una distribuzione di probabilità Come si calcola la probabilità? La velocità di consegna da parte di un’azienda con sede a Barcellona, segue una distribuzione normale ed ha una media di 185, 7 giorni ed una deviazione standard di 14, 6 giorni. Qual’è la probabilità che se faccio un ordine questo sia in sede dopo 200 giorni? 18

Esempio - Punteggi Standardizzati La velocità di consegna ha una media di 185, 7

Esempio - Punteggi Standardizzati La velocità di consegna ha una media di 185, 7 giorni ed una deviazione standard di 14, 6 giorni Valori critici densità Distribuzione Normale Standardizzata 19

Esempio - Punteggi Standardizzati Ad un test, la media della durata di una batteria

Esempio - Punteggi Standardizzati Ad un test, la media della durata di una batteria è 72 ore e la deviazione standard è 15 ore. Qual è la probabilità che acquistando una batteria, questa si scarichi dopo 60 ore ma prima di 90? Valori critici 20

Distribuzione t la distribuzione t di Student è una distribuzione simmetrica, con media 0

Distribuzione t la distribuzione t di Student è una distribuzione simmetrica, con media 0 e con deviazione standard, caratterizzata dai gradi di libertà. Al variare della numerosità campionaria, varia il numero dei gradi di libertà e, conseguentemente, varia la forma della distribuzione 21

Gradi di libertà 1920: Fisher introduce i gradi di libertà Esprimono il numero minimo

Gradi di libertà 1920: Fisher introduce i gradi di libertà Esprimono il numero minimo di dati sufficienti a valutare la quantità d'informazione contenuta. Quando un dato non è indipendente, l'informazione che esso fornisce è già contenuta implicitamente negli altri. È possibile quindi calcolare le statistiche utilizzando soltanto il numero di osservazioni indipendenti, consentendo in questo modo di 22

n 1 00 libe rtà n 95 gradi gra di di di libe rtà

n 1 00 libe rtà n 95 gradi gra di di di libe rtà % n 95 % 23

Confronto tra la distribuzione t di Student e la curva Normale Standardizzata 24

Confronto tra la distribuzione t di Student e la curva Normale Standardizzata 24

25

25