Campionamento obiettivi della presentazionee Che cosa il Campionamento
Campionamento
obiettivi della presentazionee • • • Che cosa è il Campionamento? Perchè utilizziamo i Campioni? Concetto di rappresentatività Metodi di Campionamento Errore di Campionamento Calcolo della dimensione del campione
Definizione di Campionamento Procedura per le quali alcuni membri della popolazione sono selezionati come rappresentativi della intera popolazione
perchè campioniamo le popolazioni? Dare informazioni su grandi popolazioni n Al minimo costo n A massima rapidità n Con maggiore accuratezza n Usando strumenti raffinati
Campionamento Precisione Costo
Che cosa si richiede di conoscere Concetti n rappresentatività n Campionamento : metodi n Come scegliere il giusto metodo Calcoli n errore di Campionamento n effetto del Disegno n dimensione del campione
Definizioni e termini del Campionamento Unità di Campionamento n unità di base di Campionamento (bsu) intorno alla quale il Campionamento è pianificato Frazione di Campionamento n Il rapporto tra la dimensione del campione e la dimensione della popolazione Universo di Campionamento n ogni lista di tutte le unità di Campionamento della popolazione Schema di Campionamento n metodo di selezione delle unità di Campionamento dall’universo di Campionamento
Campionamento e rappresentatività Popolazione Campionaria campione Popolazione Bersaglio popolazione Campionaria campione
Concetto di rappresentatività Persone w w età Sesso altre caratteristiche demografiche Esposizione/suscettibilità Luogo w Urbana w Rurale Tempo w Stagionalità w Giorno della settimana w Ora del Giorno
Tipo di Campionamento Non-probabilistico n Campioni di Convenienza w viziati w scenario migliore o peggiore n Campioni soggettivi w Basati sulla conoscenza w Tempo/risorse e vincoli Campionamento probabilistico n Il solo metodo di Campionamento che consente di estrarre valide conclusioni circa la popolazione
Campioni probabilistici Campionamento casuale n n n ogni soggetto ha una nota probabilità di essere scelto Riduce la possibilità di vizio di selezione di soggetti consente l’applicazione di teoria statistica ai risultati
errore di Campionamento Nessun campione è una perfetta immagine speculare della popolazione n n n La grandezza di errore può essere misurato in Campioni probabilistici Espressione dell’errore standard w di media, di proporzione, di differenze, etc Funzione della … w dimensione del campione w quantità di variabilità nella misura del fattore di interesse
metodi usati in Campionamento probabilistico Campionamento casuale semplice Campionamento sistematico Campionamento stratificato Campionamento a Cluster Campionamento Multistadio
Campionamento casuale semplice Principio – Uguale opportunità per ogni unità statistica di essere estratto Procedura – numerare tutte le unità – Estrarre unità casuali vantaggi – semplice – errore di Campionamento facilmente misurato svantaggi – richiede la completa lista di unità – non sempre ottiene la migliore rappresentatività
Esempio: Campionamento casuale semplice 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Alberto D. Riccardo D. Bella H. Raimondo L. Stéfania B. Alberto T. Giampaolo V. André D. Daniele C. Antonio Q. Giacomo B. Daniele G. Amanda L. Giovanna L. Filippa K. Eva F. Piera O. Tommaso G. Brian F. Elena H. Isabella R. Gianna T. Samanta D. Ber. Il L. 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 Monica Q. Régine D. Lucille L. Geremia W. Gilles D. Renaud S. Piero K. Michele R. Marie M. Gaétano Z. Fidèle D. Maria P. Anne-Marie G. Michele K. Gastone C. Aldo M. Olivier P. Ginevra M. Ber. Il D. Gianna P. Giacomo B. François P. Domenica M. Antonio C.
( R ): lista di numeri casuali Random Samples and Permutations Description: 'sample' takes a sample of Il specified size da Il elements of 'x' using either con or without replacement. Usage: sample(x, size, replace = FALSE, prob = NULL) Arguments: x: Either a (numeric, complex, character or logical) vector of più than one element da which to choose, or a positive integer. size: non-negative integer giving Il number of items to choose. replace: Should sampling be con replacement? prob: A vector of probability weights per obtaining Il elements of Il vector essere sampled.
(R): lista numeri casuali sample(c(0: 3000), 100, replace = TRUE) [1] 2310 2034 1455 688 2290 2809 2914 2014 2875 2165 501 65 1056 271 1858 [16] 1692 1946 509 72 497 2929 966 2190 1560 1384 790 482 2234 269 1322 [31] 333 42 90 1884 1907 699 1141 2677 2757 178 2558 1126 2745 240 738 [46] 2058 669 2171 2302 2659 1421 2416 1861 498 481 2222 1580 2378 2186 2379 [61] 1151 278 1785 63 1651 1140 1876 343 480 2066 2955 1444 2157 1107 1124 [76] 272 626 1768 1417 739 2260 75 1550 406 2085 197 642 191 2887 2506 [91] 2926 997 1383 502 973 2420 1201 1732 2865 1511
Campionamento sistematico Principio n n unità estratte con una constante intervallo tra successive unità Uguale opportunità per ogni unità di essere estratta Procedura n n n Calcolare l’intervallo di Campionamento (k = N/n) estrarre una lista di numeri casuali ( k) per starting estrarre ogni k unità dalla prima unità Vantaggi n n n Assicura rappresentatività attraverso la lista Facile da implementare Può migliorare la precisione Svantaggi n dannoso se la lista ha cicli
Esempio: Campionamento sistematico
Campionamento stratificato Principio n n n Classificare la popolazione in sottogruppi internamente omogenei (strato) estrarre un campione da ogni strato Combinare risultati di tutte le strato Vantaggi n n Più precise se variabile associated con strato Tutti sottogruppi rappresentati, allowing separate conclusioni circa la ogni di essi Svantaggi n n errore di Campionamento di difficile misurazione Perdita di precisione se tutti numeri campionati in un singolo strato
Esempio: Campionamento stratificato Determinare la copertura della vaccinazione in una regione Un campione estratto in ogni regione stima calcolata per ogni strato pesato per ottenere stima per regione (media)
Campionamento a Cluster Principio n n n campione casuale di gruppi (“clusters”) di unità In cluster selezionati, sono incluse tutte le unità o proporzioni di unità (campione) Campionamento entro cluster può essere semplice casuale o sistematico
Esempio: Campionamento una Cluster Sezione 1 Sezione 2 Sezione 3 Sezione 5 Sezione 4
Campionamento a Cluster vantaggi n n semplice poichè la lista di Campionamento completa delle unità entro popolazione non è richiesta meno richiesta di viaggi e risorse svantaggi n n Imprecisa se i clusters non sono omogenei e quindi la variazione tra campioni è maggiore della variazione nella popolazione (grande effetto del disegno) Errore di Campionamento è difficile da misurare
effetto del disegno varianza globale Var p(1 -p) ccs = -----n varianza di Cluster Σ (pi-p)² Var clus = ------k(k-1) Var clust effetto del Disegno = -------- Var ccs p= proporzione globale pi= proporzione in ogni stratum n= numeri di soggetti k= numero di strati
( R ): Calcolo dell’effetto del disegno
Campionamento Multistadio Principio n n molteplici Campioni concatenati molteplici unità statistiche vantaggi n n Non esiste una completa lista di popolazione richiesta Il più facile approccio per grandi popolazioni svantaggi n n molteplici liste di Campionamento errore di Campionamento difficile da misurare
Esempio: Campionamento Multistadio Determine una suscettibilità all’epatite tra bambini delle scuole di una regione n n campione di regioni estratte dalla nazione di città estratte da ogni regione selezionata di scuole estratte in ogni città selezionata bambini entro scuole selezionate
selezione una metodo di Campionamento popolazione che deve essere studiata n n dimensione della distribuzione geografica eterogeneità della variabile livello di precisione richiesta risorse disponibili Importance di avere una precisa stima dell’errore di Campionamento
passi nella stima dimensione del campione • • Identificare una variabile maggiore dello studio Determine tipo di stima (%, mean, ratio, . . . ) Indicare la frequenza attesa di fattore di interesse Decidere la precisione di stima desiderata Decidere il rischio accettabile che stima cada fuori dal valore dela sua popolazione reale Correggere per la stima d’effetto del disegno Correggere per attesa proporzione di risposta (Correggere per la dimensione della popolazione )
dimensione del campioneformula in descrittiva survey Campionamento casuale semplice / sistematico 1. 96²*0. 15*0. 85 z² * p * q n = ------------------ = 544 d² 0. 03² Campionamento a Cluster z² * p * q n = g* ------- = d² z: rischio alfa espresso in z-score p: attesa prevalence q: 1 - p d: absolute precisione g: effetto del disegno 2*1. 96²*0. 15*0. 85 ------------ = 1088 0. 03²
EPITABLE: Calcolo dimensione del campione a cluster
Ruolo del Campionamento in indagine descrittiva Definire obiettivo Definire risorse disponibili Identificare study popolazione Identificare variabiles to study Definire precisione richiesta Stabilire plan di analysis (questionenario) Creare Campionamento estrazione Select campione Pilot data collezione Collect data Analyse data Communicate risultati Use risultati
Conclusioni Campioni probabilistici sono I migliori Fate attenzione ai … n n n Rifiuto di partecipazione Dati mancanti “tutto ciò che non si conosce”
Conclusioni Se avete dei dubbi … Consultate uno statistico
- Slides: 35