Il campionamento Il campionamento Vantaggi per es rispetto

  • Slides: 26
Download presentation
Il campionamento

Il campionamento

Il campionamento Vantaggi (per es. rispetto a un censimento): • Riduzione dei costi •

Il campionamento Vantaggi (per es. rispetto a un censimento): • Riduzione dei costi • Riduzione dei tempi • Maggiore accuratezza e approfondimento Rischi: • Errori di copertura (es. la lista di campionamento) • Errori di non risposta (rifiuti, mancati contatti, missing o altro) • Errore di campionamento (il campione non riflette adeguatamente la popolazione target, es. autoselezione) • Dimensione campionaria inadeguata (ampiezza)

…qualche definizione • L’universo= la popolazione “teorica” oggetto di indagine • La popolazione =

…qualche definizione • L’universo= la popolazione “teorica” oggetto di indagine • La popolazione = l’insieme dei soggetti sui quali viene effettivamente svolta la ricerca sulla base di una lista di campionamento • Unità di analisi= il singolo caso rilevante per la ricerca, i soggetti dentro la lista di campionamento della popolazione • Il campione = il sottoinsieme della popolazione cui vengono applicati gli strumenti d’indagine • I casi= le unità di analisi scelte che finiscono nel campione • Il campionamento = il procedimento di selezione (nelle intenzioni, rappresentativa) dei casi dalla popolazione al campione

Universo: i lavoratori atipici della provincia di Genova Popolazione di riferimento: i lavoratori atipici

Universo: i lavoratori atipici della provincia di Genova Popolazione di riferimento: i lavoratori atipici rilevabili nelle liste dei CPI 13 4 23 11 22 18 3 15 1 16 7 14 21 2 24 Stima (procedimento induttivo) 17 5 9 19 6 12 25 20 campione 1 CAMPIONAMENTO 25 11 16 7 10 Inferenza (procedimento deduttivo) 20 8 Unità di analisi casi 91

La rappresentatività (I) Occorre che il campione possegga le caratteristiche della popolazione di origine

La rappresentatività (I) Occorre che il campione possegga le caratteristiche della popolazione di origine e le riproduca in piccola scala. 2 fattori: • Numerosità: quante unità di analisi finiscono nel campione, tanto più cresce n avvicinandosi a N, tanto più il campione è rappresentativo • Eterogeneità: quanto le unità di analisi sono diverse tra loro all’origine, tanto più il campione rispecchia l’eterogeneità, tanto più è rappresentativo

La rappresentatività (II) - Alcuni criteri per un’adeguata rappresentatività: occorre che i dati di

La rappresentatività (II) - Alcuni criteri per un’adeguata rappresentatività: occorre che i dati di partenza siano generalmente validi non si devono verificare effetti di selezione campione e popolazione devono avere distribuzioni simili si rifletta la presenza di possibili caso idealtipici adeguata copertura della popolazione (riflettere le variazioni) usare un campione probabilistico (p>0 e noto)

Il campionamento La selezione delle unità di analisi che divengono casi del campione può

Il campionamento La selezione delle unità di analisi che divengono casi del campione può avvenire con 2 metodi • Probabilistico: le unità della popolazione hanno prefissate, medesime e conoscibili probabilità di essere incluse nel campione • Non probabilistico: non si conoscono le probabilità di inclusione

La numerosità …dove n = la numerosità che si vuole ottenere z = costante

La numerosità …dove n = la numerosità che si vuole ottenere z = costante (corrispondente al valore della variabile casuale normale standardizzata) che dipende dal livello di fiducia desiderato per la stima es. 1, 96 per un livello di fiducia del 95%; 1 per il 68% = lo scarto quadratico medio (l’indice di variabilità) e= l’errore atteso

Esempio errore di stima dalla media= 0, 2 livello di fiducia del 95% =1,

Esempio errore di stima dalla media= 0, 2 livello di fiducia del 95% =1, 96 variabilità = 3 n= 1, 96 * (3/0, 2) = 29, 4 che elevato al quadrato= 864, 36 • non è sensato fare elaborazioni sotto 30 casi per un minimo di descrizione • meglio ancora non andare sotto i 100 per una popolazione estesa • spesso oltre 1000 casi non si aggiunge rappresentatività (per variabili poco eterogenee)

La ponderazione es. da una popolazione di 500 M e 1000 F… …un campione

La ponderazione es. da una popolazione di 500 M e 1000 F… …un campione stratificato x età di 100 M e 100 F …farà sì che le risposte delle 100 F valgano doppio

La curva normale M, Mo, Me -1 Sq e +1 Sq = 68% dei

La curva normale M, Mo, Me -1 Sq e +1 Sq = 68% dei casi -2 Sq e +2 Sq = 95% dei casi -3 Sq e +3 Sq = 98% dei casi N -3 Sq -2 Sq -1 Sq +2 Sq +3 Sq

Campionamenti probabilistici (tipici della ricerca standard) • • • Casuale semplice (con o senza

Campionamenti probabilistici (tipici della ricerca standard) • • • Casuale semplice (con o senza ripetizione) Sistematico Stratificato (proporzionale/non proporzionale) A grappoli A stadi Areale

Probabilistici: Casuale semplice • Estraggo a caso dalla lista di campionamento garantendo a tutte

Probabilistici: Casuale semplice • Estraggo a caso dalla lista di campionamento garantendo a tutte le unità di analisi la stessa possibilità di entrare a far parte del campione • Con o senza ripetizione, ovvero estraggo e tolgo o estraggo e rimetto (raro)

Probabilistici: sistematico • Estraggo a caso ogni tot dalla lista, ovvero definisco un passo

Probabilistici: sistematico • Estraggo a caso ogni tot dalla lista, ovvero definisco un passo di campionamento, cioè estraggo un caso ogni k, dove k=n/N (*100) • Es. per n=1000 e N=50000, k=50 • Se N non è noto posso usare un k arbitrario • Definito k estraggo a caso un numero tra 1 e k (nel nostro caso 1 tra 1 e 50) e inizio il passo di campionamento (ne prendo 1 ogni 50 a partire dal numero estratto) • …proseguo a estrarre con il passo fino a raggiungere la numerosità • Si può fare anche quando non c’è una lista

Probabilistici: Stratificato • Definisco strati su popolazione rispetto a variabili fondamentali • Rispetto alle

Probabilistici: Stratificato • Definisco strati su popolazione rispetto a variabili fondamentali • Rispetto alle unità di analisi gli strati devono essere omogenei al loro interno (intra) e eterogenei tra loro (inter) • Posso seguire un criterio di ripartizione proporzionale o non proporzionale all’incidenza degli strati rispetto alla popolazione di origine • Piano fattoriale ovvero definisco a priori delle variabili che ritengo influenzino il fenomeno. Es. genere (2 modalità, M/F), età (2 modalità, under 40/over 40) ; titolo di studio (3 modalità, basso, medio, alto). Si ottengono 2 X 2 X 3=12 combinazioni e in ognuna dovrò selezionare lo stesso numero di casi (in questo modo posso valutare meglio l’influenza delle variabili equiparandone il peso)

Probabilistici: a grappoli • Suddivido popolazione in sottoinsiemi (grappoli) es. divido una popolazione di

Probabilistici: a grappoli • Suddivido popolazione in sottoinsiemi (grappoli) es. divido una popolazione di scuole per regioni/province/comuni • Scelta casuale sui grappoli es. seleziono casualmente • Rilevo su tutte le unità dei grappoli scelti • Es. scelti a caso 1 e 3, rilevo su tutte le unità di 1 e 3 4 3 1 2

Probabilistici: a stadi (2 o +) • Suddivido popolazione in sottoinsiemi (unità di primo

Probabilistici: a stadi (2 o +) • Suddivido popolazione in sottoinsiemi (unità di primo stadio)…es. regioni • Scelta casuale dei sottoinsiemi su unità di primo stadio • Scelta casuale delle unità selezionate in primo stadio (secondo stadio) Es. su 3 stadi per studenti scuole medie italiane: 1. I stadio - scelta casuale tra comuni d’Italia 2. II stadio - scelta casuale tra scuole medie dei comuni scelti 3. III stadio - scelta casuale tra gli studenti delle scuole scelte dei comuni scelti

Probabilistici …naturalmente, niente e nessuno mi impedisce di poter combinare le tecniche anzidette…es un

Probabilistici …naturalmente, niente e nessuno mi impedisce di poter combinare le tecniche anzidette…es un campionamento areale stratificato con passo sistematico

Guida alla definizione di un campione • • Definire la popolazione in spazio e

Guida alla definizione di un campione • • Definire la popolazione in spazio e tempo Elencare criteri inclusione/esclusione rispondenti Specificare unità di analisi Costruire lista campionamento Identificare variabili chiave e loro eterogeneità Valutare errore Stabilire numerosità campionaria Definire criterio campionamento

Campionamenti non probabilistici (tipici della ricerca non standard) • • • A casaccio Per

Campionamenti non probabilistici (tipici della ricerca non standard) • • • A casaccio Per quote Auto-selezionato Testimoni privilegiati A valanga

Non probabilistici: a casaccio è il cosiddetto campionamento accidentale Es. : mi metto all’angolo

Non probabilistici: a casaccio è il cosiddetto campionamento accidentale Es. : mi metto all’angolo di una strada e scelgo il primo caso che capita, senza criteri definiti, ma solo in ragione di praticità e velocità

Non probabilistici: per quote • È come uno ovvero definisco delle quote di popolazione

Non probabilistici: per quote • È come uno ovvero definisco delle quote di popolazione in base alle variabili che mi interessano Diplomati Laureati • Es: Maschi 50 50 Femmine 50 50 • in genere non è proporzionale, ma può riflettere le caratteristiche della popolazione

Non probabilistici: autoselezionato …Laddove i casi si selezionano da soli rispondendo alla somministrazione… Esempi:

Non probabilistici: autoselezionato …Laddove i casi si selezionano da soli rispondendo alla somministrazione… Esempi: • il televoto • alcune survey online • alcuni questionari di gradimento

Non probabilistici: Testimoni privilegiati • Campione di esperti • Campione sociologico • Si basa

Non probabilistici: Testimoni privilegiati • Campione di esperti • Campione sociologico • Si basa essenzialmente sulle caratteristiche predefinite degli individui • Tipico dei Delphi o dei Focus group

Non probabilistici: a valanga • Scelgo alcuni casi di partenza (possibilmente “idealtipici” o testimoni

Non probabilistici: a valanga • Scelgo alcuni casi di partenza (possibilmente “idealtipici” o testimoni privilegiati) • Chiedo loro di fornirmi altri conoscenti da intervistare con tali caratteristiche • Più fasi possibili • Rischi di condizionamento sulla base del capitale relazionale delle persone