ZKLADY METODOLOGIE Lekce 05 Vzkumn soubor Ji enk
ZÁKLADY METODOLOGIE Lekce 05: Výzkumný soubor Jiří Čeněk
OBSAH LEKCE Úvod do výběru vzorku Vzorek a populace Chyba výběru a výběrové zkreslení Typy výběru � Pravděpodobnostní výběr � Nepravděpodobnostní výběr Velikost souboru v kvalitativním a kvantitativním výzkumu
VÝBĚR VZORKU
VÝBĚR - PŘÍKLAD Problém: Kulturní adaptace mezinárodních studentů v ČR. VO 1: Jak dlouho mezinárodním studentům trvá se adaptovat na českou kulturu. VO 2: Jaké jsou hlavní problémy, se kterými se během svého procesu adaptace setkávají? Jak byste postupovali?
SAMPLING - EXAMPLE Krok 1: Výběr designu výzkumu a metody � Chceme získat hluboký vhled do tohoto procesu na malém vzorku? → pravděpodobně kvalitativní design, třeba rozhovory? � Chceme získat o něco méně detailní vhled na větším souboru a být schopní zobecňovat? → pravděpodobně kvalitativní design, třeba dotazníky? � Nebo kombinace? → smíšený design, více metod? Krok 2: Rozhodnutí o vzorku � Jaké faktory je třeba zvážit? � Jak dlouho už mají být v ČR? Jaké národnosti chceme zapojit? Věkové omezení? Jaká by měla být velikost? Jakou metodu výběru použijeme? Jak se k participantům dostaneme? …
POPULACE A VZOREK Populace: univerzum případů, ze kterých vybíráme vzorek. Vzorek (soubor): segment populace, který zkoumáme. Reprezentativní vzorek: vzorek, který reflektuje populaci tak přesně, že má totožné charakteristiky. Generalizace: Usuzování o populaci na základě studia vzorku.
CHYBA VÝBĚRU A VÝBĚROVÉ ZKRESLENÍ
ZDROJE CHYB V GENERALIZACI (INFERENCI)
CHYBY SOUVISEJÍCÍ S VÝBĚREM Odchylky odhadů od skutečných hodnot nezpůsobené výběrem: � Chyby v odpovědích respondentů způsobené úmyslným lhaním, neporozuměním ; � Chyby v záznamu dat nebo jejich kódování do datové matice � Pseudo-názory produkované respondenty v případech, kdy nemají na dané téma názor, ale nechtějí to přiznat � Další chyby ve sběru dat, chybějící odpovědi a práce s nimi, další inkonzistence dat
PSEUDO-NÁZORY PŘÍKLAD Metallic metals act (Gill, 1947, USA) Fiktivní zákon Respondenti měli vybrat odpověď na následující otázku: Jaký z následujících výroků nejpřesněji reflektuje váš názor na „Metallic Metals Act“? � Ze strany USA by se jednalo o dobrý krok. � Byl by to dobrý krok, ale měl by se ponechat v kompetenci jednotlivých federálních států. � Je vhodný pro jiné státy, ale není vhodné ho prosazovat v USA. � Nemá žádný smysl.
PSEUDO-NÁZORY PŘÍKLAD 70% respondentů na tuto otázku projevilo názor. Důsledky: Dobře demonstruje problémy s otázkami s nucenou volbou. → Možnost „Nevím“ → Podobné „chytáky“ v průzkumech veřejného mínění, které pomohou odhadnout přítomnost pseudo-názorů
CHYBA VÝBĚRU Populace 200 lidí, vzorek 50 Proměnná: zda se lidé dívají na „soap opery“, zastoupení v populaci 50: 50
CHYBA VÝBĚRU = Rozdíl v charakteristikách populace a výzkumného souboru. Náhodná chyba Inherentní proces výběru! Systematická chyba Závisí na kvalitě metody výběru Lze ji minimalizovat vhodnou metodou Jedním ze zdrojů je výběrové zkreslení.
VÝBĚROVÉ ZKRESLENÍ Dochází k němu, když je vzorek vybrán takovým způsobem, že některé jednotky dané populace mají nižší pravděpodobnost výběru než jednotky jiné. Výsledky jsou zkreslené a my chybně usuzujeme, že popisují zkoumaný fenomén. Výběrové zkreslení vede k disproporcionalitě výzkumného souboru: � Jednotky populace s určitými charakteristikami jsou nadreprezentovány. � Jednotky populace s jinými charakteristikami jsou podreprezentovány.
VÝBĚROVÉ ZKRESLENÍ TYPY Výběr na určitém specifickém místě: Situace: Mezi občany Brna děláme průzkum kvality veřejných služeb. Data sbíráme před hlavním nádražím. Jaké výběrové zkreslení můžeme očekávat? (Čili členové jakých subpopulací budou mít menší šanci být vybráni? )
VÝBĚROVÉ ZKRESLENÍ TYPY Lidé, kteří necestují vlakem? Cyklisté? Lidé, kteří bydlí v Židenicích a jezdí z jiného nádraží? Lidé s auty? Jak v tomto případě snížit výběrové zkreslení, ale stále sbírat data na ulici? Více lokací? Doplnění internetovým průzkumem?
VÝBĚROVÉ ZKRESLENÍ TYPY Samovýběr: Mají-li respondenti kontrolu nad tím, zda budou či nebudou participovat ve výzkumu (etika výzkumu? ). Rozhodnutí respondentů o participaci může korelovat v vlastnostmi pozorovanými ve studii. Vede k nereprezentativním souborům. Např. Pravděpodobnost účasti ve výzkumu je vyšší u lidí extrémními názory na dané téma. U apatických jedinců může být šance nižší.
VÝBĚROVÉ ZKRESLENÍ – PŘÍKLAD Z HISTORIE Ke klasickému příkladu VZ došlo během prezidentských voleb v roce 1948. V předvečer voleb deník Chicago Tribune vytiskl článek s titulkem „DEWEY DEFEATS TRUMAN“. Telefonický průzkum Proč si myslíte, že výsledky nebyly přesné? Telefony v té době nebyly dostatečně rozšířené. Lidé s domácími telefony nebyli reprezentativní pro celou populaci (bohatší, bílí)
TYPY VÝBĚRU
TYPY VÝBĚRU
PRAVDĚPODOBNOSTNÍ VÝBĚR Prostý náhodný výběr Každá jednotka populace má stejnou pravděpodobnost být vybrána do vzorku. Aka loterie Příklad: 9000 studentů na Mendelu, chceme vzorek 450. Pravděpodobnost jednotky být vybrána do vzorku je: Generátor náhodných čísel
PRAVDĚPODOBNOSTNÍ VÝBĚR Stratifikovaný výběr Když populace není homogenní a chceme se vyhnout pod-/nadreprezentování určitých skupin díky náhodné chybě výběru, můžeme zvážit využití stratifikovaného výběru. Příklad: Očekáváme, že se studenti budou lišit podle toho, co studují. Stratifikujeme populaci podle kritéria a v každé skupině (sg. stratum/pl. strata) vybíráme prostým náhodným výběrem. Lze použít více kritérií
PRAVDĚPODOBNOSTNÍ VÝBĚR Stratifikovaný výběr
PRAVDĚPODOBNOSTNÍ VÝBĚR Vícestupňový výběr (Klastry) Chceme-li například národně reprezentativní soubor Je možné získat data ze všech univerzit ve všech městech ve všech krajích? Několik stádií pravděpodobnostních výběrů Prostých náhodných či stratifikovaných
NEPRAVDĚPODOBNOSTNÍ VÝBĚR Výběr na základě dostupnosti Vzorek vybíráme podle jeho dobré dostupnosti. E. g. studenti, spolužáci, spolupracovníci Problém? Jsou studenti FRRMS reprezentativním vzorkem pro všechny občany ČR, všechny studenty v ČR, všechny studenty Mendelu? Problém zobecnitelnosti
NEPRAVDĚPODOBNOSTNÍ VÝBĚR Metoda sněhové koule
NEPRAVDĚPODOBNOSTNÍ VÝBĚR Metoda sněhové koule Užitečné pro těžce dostupné populace Kdy charakteristiky populace nejsou známy E. g. narkomani, prostitutky, vězni Často využívané v kvalitativním výzkumu
NEPRAVDĚPODOBNOSTNÍ VÝBĚR Kvótní výběr Intenzivně využíván v komerčních výzkumech (výzkum trhu, politické preference) Cíl: vzorek reflektující populaci v poměrném zastoupení jednotek podle různých kategorií jako je gender, etnicita, věková skupina, socioekonomický status, region, …a kombinace těchto kategorií. Nenáhodný Kvóta: počet jednotek v každé kategorii Kvóty odrážejí relativní poměr jednotek s podobnými charakteristikami v populaci.
NEPRAVDĚPODOBNOSTNÍ VÝBĚR Kvótní výběr
NEPRAVDĚPODOBNOSTNÍ VÝBĚR Kvótní výběr – kritika Nemůže být reprezentativní � Nenáhodný výběr jednotek � U jednoítek není stejná pravděpodobnost výběru Výhody � Levnější a rychlejší než náhodné výběry � Dobrý u exploratorních výzkumů
VELIKOST SOUBORU
VELIKOST SOUBORU Jak velký má být výzkumný soubor? Vždy se jedná o kompromis mezi náklady a chybou výběru Obecně čí větší soubor, tím větší chyba Obecně závisí na heterogenitě populace v dané cílové proměnné: čím více heterogenní, tím větší soubor potřebujeme (např. více skupin) = závisí na variabilitě cílové charakteristiky
VELIKOST SOUBORU Jak velký má být výzkumný soubor? Příklad: Prostý náhodný výběr Závisí na cílové chybě výběru, resp. Přesnosti odhadu populace.
VELIKOST SOUBORU V KVALITATIVNÍM VÝZKUMU Zobecnitelnost často není cílem kvalitativního výzkumu (malé, specifické populace). Teoretická nasycenost: Fáze v analýze kvalitativních dat, kdy se přestaneme dozvídat nové poznatky.
VELIKOST SOUBORU - CVIČENÍ
G*POWER V PĚTI KROCÍCH K odhadu velikosti souboru použijte G*Power Download: http: //www. psychologie. hhu. de/arbeitsgruppen/allgemeine -psychologie-und-arbeitspsychologie/gpower. html Manual: http: //www. psychologie. hhu. de/fileadmin/redaktion/Fakultaeten/Mathematisch. Naturwissenschaftliche_Fakultaet/Psychologie/AAP/gpower/GPower. Manual. pdf
G*POWERV PĚTI KROCÍCH Když nevíte jak, vygooglete to! Power analysis = analýza síly testu
G*POWER V PĚTI KROCÍCH Krok 1: Vyberte typ analýzy síly testu: Vždy „A priori: Compute sample size…“
G*POWER V PĚTI KROCÍCH Krok 2: Vyberte rodinu testu, vyberte konkrétní test
G*POWER V PĚTI KROCÍCH Krok 2: Vyberte rodinu testu, vyberte konkrétní test � Závisí na počtu a charakteru proměnných, počtu skupin � Provádíte-li více statistických testů, vypočítejte velikost souboru pro tu nejnáročnější z nich (výpočet většího množství parametrů modelu), = zpravidla nejvíce proměnných v modelu, nejvíce porovnávaných skupin � Nejste-li si jisti, která ze statistických metod je náročnější na soubor, vypočítejte více analýz síly testu. � Podívejte se do manuálu, konzultujte se vedoucím či statistikem. Více se o výběru správné statistické metody budeme bavit v příští lekci.
G*POWER V PĚTI KROCÍCH Krok 3: Nastavte předpokládanou velikost účinku (effect size) Kvantifikace velikosti fenoménu.
G*POWER V PĚTI KROCÍCH Krok 3: Nastavte předpokládanou velikost účinku (effect size) Více o velikosti účinku budeme mluvit na příští přednášce. Lze jí odhadnout na základě již provedených výzkumů � Často přímo reportované (corelace, Cohenovo d) � Lze jí vypočítat, známe-li N, průměry a směrodatné odchylky � https: //www. psychometrica. de/effect_size. html Lze využít „rule of thumb“ (pro každou metodu v manuálu G*Power, přímo v programu)
G*POWER V PĚTI KROCÍCH Krok 4: Vyberte α, Power a potenciálně další parametry (počet skupin, atd. ) Vychází z testování statistických hypotéz Snažíme se vybalancovat statistickou chybu, která je integrální součástí testování hypotéz. Více v příští lekci.
G*POWER V PĚTI KROCÍCH Krok 5: Klikněte na „Calculate“
CVIČENÍ Vypočítejte vzorek potřebný pro srovnání obvodu pasu u mužů a žen. T-test, průměry – 2 skupiny Vypočítejte ES (Cohenovo D) Nastavte Two tails, α = 0. 05, Power = 0. 8 Klikněte Calculate
DĚKUJI
- Slides: 46