Paramteres s nem paramteres prbk alkalmazsa tbb csoport
Paraméteres és nem paraméteres próbák alkalmazása több csoport összehasonlítására folytonos változók esetén Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem III. Sz. Belgyógyászati Klinika 2019 -03 -13 Prohaszka. zoltan@med. semmelweis-univ. hu
Megválaszolandó kérdések Különbözik-e egymástól a férfiak és a nők BMI-je? Változik-e a vércukor szint egy gyógyszeres kezelés hatására? Emelkedik-e a koleszterint szint a kor előrehaladtával? Más-e a vérnyomás a különböző stádiumú betegekben? ►Létezik-e (szignifikáns) különbség két vagy több betegcsoport átlaga között?
• Egy nagyobb adatbázisban végtelen számú kérdés tehető fel…. • Mindig tegyük fel a kutatási kérdést előre, és csak azt a kérdést teszteljük a dolgozatban, amire valóban kíváncsiak vagyunk – Nem kötelező tesztet végezni ott, ahol nincs kérdés, csak adatot közlünk – Előnye nincs, hátránya lehet • Nézzünk két példát!
• „It was aimed to explore the relation of work instability with fatigue, depression, and anxiety in working AS patients comparing with healthy controls. ”
• „In this study, we investigated whether smoking and HLA-DRB 1 shared-epitope (SE) alleles interact differently in the development of the two major subgroups of rheumatoid arthritis (RA), anticitrullinated proteins antibody (ACPA)-positive and ACPA-negative disease, in a multiethnic population of Asian descent. ”
Megfelelő statisztikai próba kiválasztása folytonos változók közötti különbségek vizsgálatára • Hány csoportunk van? – 2 – 3 vagy több • Függetlenek a mintáink? – független csoportok – nők vs. férfiak, súlyos vs. enyhébb betegek – kapcsolt csoportok – • ua. kezelés előtt vs. kezelés után, • ua. 10 év múlva • valamilyen kritérium alapján előre felállított párok • Normál eloszlású a minta? – normál eloszlás (az átlag és a szórás jól használható → paraméteres teszt – nem normál eloszlás → transzformálás /nem paraméteres teszt
Paraméteres Normál eloszlás (vagy egyéb bizonyos fajta) Nem paraméteres Nem normál (ferdült) eloszlás esetén Eloszlásfüggetlen (nem feltételfüggetlen!) A próba a tényleges Pl. : a próba sorrendbe állítja az összes értékekkel számol értéket, a sorszámokkal (rangok) Az orvosi gyakorlatban számol (rang-transzformáció) viszonylag ritka, de az adatok normál eloszlásúvá Az orvosi gyakorlatban gyakoribb transzformálhatóak (pl. logaritmizálás)
Normál eloszlásból származik a mintám? A populáció eloszlása nem ismert, a mintát vizsgálom Hisztogram készítése, normál görbe ráfektetése, szemmel ellenőrzés – kis esetszám? Shapiro-Wilks teszt Ho – az eloszlás normál H 1 – az eloszlás eltér a normálistól ► ha a próba szignifikáns, az eloszlás nem normál Bizonytalanság esetén? tekintsük úgy, mintha nem normál eloszlású lenne a mintánk, mert ha normál eloszlású adatokon nem parametrikus tesztet végzünk, gyakorlatilag a parametrikus teszttel azonos eredményt kapunk, míg fordított esetben ez nem áll fent! Hatékonyság vesztés!
Mintaszám? Hány csoport? 2 minta igen nem 3 vagy több igen Független minták? nem Normál eloszlású a minta? igen nem 2 mintás t-próba igen Páros t-próba Mann-Whitney t. Paraméteres próbák nem igen nem 1 szempontos AVOVA Wilcoxon t. igen nem Ismételt méréses ANOVA Kruskal-Wallis t. Nem paraméteres próbák Friedman próba
Két mintás t-próba (unpaired T-test) • • • Feltétele: ismeretlen, de feltételezhetően azonos szórások Két minta átlagát hasonlítja össze – ebből következtetünk a populáció átlagára H 0 – a két mintavételi populáció azonos H 1’ – az egyik mintavételi populáció nagyobb H 1” – az két mintavételi populáció különböző (bármelyik lehet nagyobb) Képlettel számítjuk a t – értéket (minél nagyobb, annál nagyobb eltérésre utal) Táblázatból ismert, hogy adott szabadságfok mellett mekkora p (probability) érték tartozik hozzá Ha a p-érték kellően kicsi – elvetjük a nullhipotézist (H 0 -t) Mi a kellően kicsi? – előre meghatározott érték, a szignifikancia küszöb. Ált. 0, 05, vagyis 5% (minden 20. döntésem lesz fals pozitív). Ha a p ennél kisebb, mondhatjuk, hogy a két populáció közötti különbség szignifikáns A p-érték annak a valószínűsége, hogy elsőfajú hibát követek el (hibásan utasítom el a H 0 -t) ► p-érték annak a valószínűsége, hogy mégis igaz a H 0
Egyoldali vagy két oldali próba (one-tailed, two-tailed) A kérdés (az alternatív hipotézis) határozza meg melyik szükséges Egyoldali próba – egyirányú eltérést vizsgálok (H 1’) pl. az egyik pop. nagyobb Kétoldali próba – kétirányú eltérés (H 1”) pl. a két pop. különbözik Melyik a „szigorúbb”? A kétoldali próba! (az ábrán a piros) A STATISTICA eleve kétoldali próbához tartozó p-értéket ad meg. Ha a kérdésfeltevésünk indokolja (lehetővé teszi) az egyoldali próbát, a kapott p-értéket osszuk el kettővel (az ábrán a kék intervallum)
Elérési útvonal STATISTICA-ban: Statistics // Basic statistics/Tables// t-test, independent, by groups A számított statiszika értéke Degree of freedom, szabadságfok. A két csoport esetszáma -2 A kétoldali próbához tartozó pérték Megj. : A t-próba akkor végezhető, ha a két csoport varianciája megegyezik. Ha nem vagyunk biztosak a szórások egyenlőségében, akkor Welch próbát kell használni. (F próba ezt vizsgálja, de nem helyes ez alapján választani a próbát)
Mann-Whitney teszt Például? – férfiak vagy a nők BMI-je nagyobb? H 0 – nincs különbség a két csoport között
Mann-Whitney teszt feltétele • A két folytonos változó sűrűségfüggvénye azonos alakú (egymásba eltolással átvihetők) • Tehát a szórások közel azonosak!
Elérési útvonal: Statistics (felső parancssor) // Nonparametrics //Compairing two independent samples (groups) A próba Ábra készítése
Csoporttól függetlenül adott rangszámok csoportösszege A rangszámösszegből számolt statisztika értéke és a hozzá tartozó p-érték esetszám Ha az egyik csoport minden egyes eleméhez hozzárendeljük a másik csoport minden egyes elemét, akkor a két csoport esetszámainak szorzatával egyenlő számú párt kapunk (144 x 50=7200 db-t). Az U azt mutatja meg, hogy hány ilyen párban nagyobb az első érték, mint a második (+ az egyenlő párok számának a fele). Ha egyforma lenne a HGB a férfiak és a nők között, az U 7200/2=3600 lenne. Mivel az eredményekből (rangszámok összege) csak nehézkesen állapítható meg, hogy melyik csoportban vannak a nagyobb értékek, érdemes grafikusan ábrázolni.
• Például? Páros t-próba - Változott-e egy év elteltével a betegek Na szintje (felt. norm. eloszlás) • H 0 – a különbségek átlaga = 0
• Elérési útvonal STATISTICA-ban: Statistics // Basic statistics/Tables // t-test, dependent samples Itt is lehet ábrát kérni!
A mintapárok közötti különbségeken alapul a t-értéket meghatározó képlet, de szerepel benne a szórás (SD) is. Jelen esetben a p-érték nagyobb, mint a küszöb érték, a H 0 -t nem vetjük el, a csoportok között nincs különbség. (Megtévesztő lehet, de akár kis eltérés is lehet szignifikáns, ha az eltérések szórása kicsi. Könnyen belátható, hogy ha pl. 0, 5 az átlagos eltérés, de az a 0, 4 -0, 6 tartományba esik, az egy jelentős különbség. Míg abban az esetben, ha ugyancsak 0, 5 az eltérések átlaga, de az értékek -1 és 2 között szórnak, akkor nincs tényleges különbség a két csoport között) Megj. : hamis eredményt kaphatunk, ha a két mérés nem azonos módszerrel történik, vagy pl. nem azonos a mértékegység!
• Például? Wilcoxon próba - Változott-e egy év elteltével a betegek Na szintje ( nem norm. eloszlás) • H 0 – a különbségek átlaga = 0
• Elérési útvonal STATISTICA-ban: Statistics // Nonparametrics // Comparing two dependent samples (variables) l A próba előjeltől függetlenül rangsorolja a két minta közötti különbségeket, majd a negatív és a pozitív különbségekhez tartozó rangokkal számol.
• Például? Egyszempontos ANOVA - Különböznek-e egymástól a más-más NYHA stádiumban lévő szívelégtelen betegek kreatinin szintjei? (felt. norm eloszlást)
ANOVA = Analysis of Variance Több csoport összehasonlításánál kézenfekvő, de nem helyes párokat alkotni és azokat t-teszttel összehasonlítani (a többszörös összehasonlításból eredő fals pozitív következtetések növekvő aránya miatt). Ha a csoportok egy szempont szerint különböznek (pl. betegség súlyossága)→ egyszempontos (one-way, egyutas ANOVA) Ha több (további) szempont szerint is vizsgáljuk (pl. betegség súlyossága és nem) → többszempontos ANOVA H 0 – mindegyik minta ugyanolyan átlagú sokaságból származik. A csoportokon belüli és a csoportok közötti varianciát elemzi
• Elérési útvonal STATISTICA-ban: Statistics // ANOVA // one-way ANOVA Osztályozó vagy független változó Függő változó – a mért vagy megfigyelt adatok
• Ha a teszt szignifikáns eredményt ad, a csoportok közül legalább az egyik nem azonos populációból származik • A kísérleti tervtől függően választott elemzéssel meghatározhatjuk, hogy melyik csoport különbözik
• Például? Kruskal-Wallis próba - Különböznek-e egymástól a más-más NYHA stádiumban lévő szívelégtelen betegek kreatinin szintje? (nem norm eloszlás)
Median test – a K-W-t „egyszerűbb” változata. Ha sok kiugró érték van, megbízhatóbb Páronkénti összehasonlítások eredményei Elérési útvonal STATISTICA-ban: Statistics // Nonparametrics // Comparing multiple indep. samples
• Például? Friedman próba - Változik-e a koleszterint szint 5 évenként mérve?
Elérési útvonal STATISTICA-ban: Statistics // Nonparametrics // Comparing multiple dep. Samples (variables)
Általános vizsgálati szempontok • Először fogalmazzuk meg a kérdést, ehhez keressük meg a megfelelő próbát • Ne csak a p-értéket nézzük, próbáljunk utánagondolni az eredményeknek (pl. Mann-Whitney tesztnél U), különösen a párosított teszteknél (változás mértéke, iránya, stb. ). • Ábrázoljuk ellenőrzésképpen grafikusan is! • Orvosi gyakorlatban leggyakrabban nem paraméteres teszteket használunk • A programmal két csoportot könnyen több száz változó szerint is összehasonlíthatunk (szignifikancia vadászat). Ilyenkor ne felejtsük el lejjebb vinni a szignifikancia küszöböt (Bonferroni korrekció). Definícióból adódik, hogy 100 db 0, 05 p-értékű tesztnél valószínűleg 5 szignifikáns eltérést mutat még akkor is, ha a két minta nem különbözik!
Összefoglalás folyamatos változók (pl. életkor, se Na) normál eloszlású 2 független csoport összehasonlítása 2 kapcsolt csoport összehasonlítása (pl. érték kezelés előtt és kezelés után) 3 vagy több független csoport összehasonlítása 3 vagy több kapcsolt csoport összehasonlítása nem normál eloszlású két mintás t-próba Mann-Whitney teszt Basic stat. /Tables//T test, independent, by groups Nonparametrics//Comparing two independent samples (groups) Szignifikánsan különbözik-e a súlyos és nem súlyos betegek vércukor értéke? páros t próba Wilcoxon teszt Basic stat. /Tables//T test dependent samples Nonparametrics//Comparing two dependent samples (variables) Megváltozik-e a betegek fehérvérsejt száma a kezelés hatására? Változike a betegek koleszterinszintje 10 év követés alatt? egy szempontos ANOVA Kruskal-Wallis teszt ANOVA//One-way ANOVA//All effects Nonparametrics//Compairing multiple independent samples (groups) Van-e különbség a különböző Dukes stadiumú betegek hemoglobin szintjében? ismételt méréses ANOVA Friedman próba ANOVA//Repeated measures ANOVA Nonparametrics//Compairing multiple dependent samples (groups) Az ismételt mérések során változik-e a betegek BMI-je?
Köszönöm a figyelmet!
- Slides: 36