Wat zegt een steekproef Suikergehalte van cola Steekproef

  • Slides: 16
Download presentation

Wat zegt een steekproef? Suikergehalte van cola Steekproef 1 Gehalte = 101 g/L en

Wat zegt een steekproef? Suikergehalte van cola Steekproef 1 Gehalte = 101 g/L en n-1 = 6 g/L Steekproef 2 Gehalte = 105 g/L en n-1 = 4 g/L Steekproef 3 Gehalte = 98 g/L en n-1 = 7 g/L Welke steekproef is het meest betrouwbaar? Welke uitslag geven we door? 2

Wat ontbreekt hier? Suikergehalte van cola Steekproef 1 n = 5 Gehalte = 101

Wat ontbreekt hier? Suikergehalte van cola Steekproef 1 n = 5 Gehalte = 101 g/L en n-1 = 6 g/L Steekproef 2 n = 3 Gehalte = 105 g/L en n-1 = 4 g/L Steekproef 3 n = 10 Gehalte = 98 g/L en n-1 = 7 g/L Welke steekproef is nu het meest betrouwbaar? Hoeveel samples moet je nemen? 3

Onderzoek Gemiddelde lichaamslengte Nederlandse mannen van 20 jaar steekproef n lengte (cm) n-1 1

Onderzoek Gemiddelde lichaamslengte Nederlandse mannen van 20 jaar steekproef n lengte (cm) n-1 1 3 178, 2 9, 1 2 10 181, 2 7, 1 3 60 177, 6 7, 5 Steekproef nog groter maken? Welke steekproef is het meest betrouwbaar? Hoeveel samples moet je nemen? 4

Andere opzet We gaan steekproeven 10 x herhalen Bepaling gemiddelde lengte Nederlandse mannen (cm)

Andere opzet We gaan steekproeven 10 x herhalen Bepaling gemiddelde lengte Nederlandse mannen (cm) 3 samples 10 samples 25 samples gem gem n-1 168, 4 8, 5 178, 0 10, 2 178, 9 181, 3 12, 0 178, 1 8, 6 180, 0 182, 2 7, 4 180, 9 8, 3 179, 3 181, 5 9, 1 176, 5 9, 8 180, 4 175, 5 8, 9 183, 8 8, 2 178, 3 179, 7 8, 9 179, 3 7, 4 180, 1 180, 6 10, 5 178, 8 9, 4 181, 7 177, 8 5, 2 178, 4 5, 3 179, 9 181, 6 10, 6 183, 8 8, 6 180, 3 181, 1 11, 6 178, 9 4, 9 178, 4 n-1 8, 9 9, 4 7, 8 6, 9 8, 6 9, 6 6, 6 7, 7 6, 9 6, 8 Valt je iets op? De verschillen lijken kleiner te worden Kon je dat verwachten? Hoe onderzoek je of dat klopt? • Gemiddelde berekenen • Standaarddeviatie van die gemiddelden berekenen 5

Andere opzet Kleinere steekproeven herhalen Bepaling gemiddelde lengte Nederlandse mannen (cm) 3 samples 10

Andere opzet Kleinere steekproeven herhalen Bepaling gemiddelde lengte Nederlandse mannen (cm) 3 samples 10 samples 25 samples gem gem n-1 168, 4 8, 5 178, 0 10, 2 178, 9 181, 3 12, 0 178, 1 8, 6 180, 0 182, 2 7, 4 180, 9 8, 3 179, 3 181, 5 9, 1 176, 5 9, 8 180, 4 175, 5 8, 9 183, 8 8, 2 178, 3 179, 7 8, 9 179, 3 7, 4 180, 1 180, 6 10, 5 178, 8 9, 4 181, 7 177, 8 5, 2 178, 4 5, 3 179, 9 181, 6 10, 6 183, 8 8, 6 180, 3 181, 1 11, 6 178, 9 4, 9 178, 4 gemiddelde van 10 steekproeven van 3 samples n-1 8, 9 9, 4 7, 8 6, 9 8, 6 9, 6 6, 6 7, 7 6, 9 6, 8 gemiddelde van 10 steekproeven van 10 samples gemiddelde van 10 steekproeven van 25 samples gem 179, 0 gem 179, 7 gem 180, 7 n-1 4, 2 n-1 2, 5 n-1 1, 5 Het gemiddelde is praktisch hetzelfde De standaarddeviatie van de gemiddelden wordt kleiner als je het aantal samples per steekproef groter maakt 6

Andere opzet Kleine steekproeven 50 x herhalen: histogram Blijkbaar zijn de steekproefgemiddelden ook normaal

Andere opzet Kleine steekproeven 50 x herhalen: histogram Blijkbaar zijn de steekproefgemiddelden ook normaal verdeeld, maar hun standaarddeviatie neemt af als we het aantal samples groter maken. Definitie De standaarddeviatie van de steekproefgemiddelden noemt men de standaardfout SE (Eng: standard error) gemiddelde van 10 steekproeven van 3 samples gemiddelde van 10 steekproeven van 10 samples gemiddelde van 10 steekproeven van 25 samples gem 179, 0 gem 179, 7 gem 180, 7 n-1 4, 2 n-1 2, 5 n-1 1, 5 7

Andere opzet Kleinere steekproeven herhalen 8

Andere opzet Kleinere steekproeven herhalen 8

Schatting van het populatiegemiddelde van 10 steekproeven van 3 samples gemiddelde van 10 steekproeven

Schatting van het populatiegemiddelde van 10 steekproeven van 3 samples gemiddelde van 10 steekproeven van 10 samples gemiddelde van 10 steekproeven van 25 samples gem 179, 0 gem 179, 7 gem 180, 7 n-1 4, 2 n-1 2, 5 n-1 1, 5 Wat is volgens jou de beste schatting van de gemiddelde lengte van Nederlandse mannen van 20 jaar. 180, 7 cm? Men noemt dit een puntschatting. Waarom? Hoeveel % betrouwbaar is een puntschatting? 0 % !! Beter is een intervalschatting van het populatiegemiddelde, dus het gemiddelde ligt tussen ……cm en ……. . cm wiskundige notatie ………cm < μ < ……. . cm Zo’n schatting noemt men een betrouwbaarheidsinterval 9

Betrouwbaarheidsinterval Van een normaalverdeling zijn het gemiddelde en de standaarddeviatie n bekend. Een normaalverdeling

Betrouwbaarheidsinterval Van een normaalverdeling zijn het gemiddelde en de standaarddeviatie n bekend. Een normaalverdeling geldt (helaas) alleen voor een hele populatie. Hele populatie Populatiegemiddelde Z-waarde = aantal standaarddeviaties Voor een willekeurig getrokken sample uit een populatie geldt dus een kans van 95 % dat hij tussen -2 en +2 ligt. Er is ook een kans van 99 % dat hij tussen -3 en +3 ligt. 10

Betrouwbaarheidsinterval De standaardfout SE kunnen we gebruiken in combinatie met de Z-waarden van de

Betrouwbaarheidsinterval De standaardfout SE kunnen we gebruiken in combinatie met de Z-waarden van de normaalverdeling. We willen een betrouwbaarheid van 95 %. Voor de Z-waarde nemen we de nauwkeurige waarde van 1, 96 (zie Z-tabel) Voor de schatting van gebruiken we de standaardfout SE Het betrouwbaarheidsinterval BI voor de schatting van het populatiegemiddelde wordt dan: 11

Betrouwbaarheidsinterval We gebruiken de resultaten van de steekproef met 25 samples. gem = 180,

Betrouwbaarheidsinterval We gebruiken de resultaten van de steekproef met 25 samples. gem = 180, 7 cm met SE = 1, 5 cm Invullen geeft: 180, 7 -1, 96 × 1, 5 < μ < 180, 7 +1, 96 × 1, 5 BI: 177, 8 cm < μ < 183, 6 cm In woorden De gemiddelde lengte van Nederlandse mannen van 20 jaar ligt met een betrouwbaarheid van 95 % tussen 177, 8 cm en 183, 6 cm. Probleem: We moeten de standaardfout SE te weten komen. 12

Betrouwbaarheidsinterval Hoe vinden we de standaardfout SE ? • Veel steekproeven doen zoals bij

Betrouwbaarheidsinterval Hoe vinden we de standaardfout SE ? • Veel steekproeven doen zoals bij de lengtemeting, in dit geval dus 10 keer 25 = 250 metingen. • De standaardfout berekenen met behulp van de standaarddeviatie van de populatie (als die tenminste bekend is). Dat is bijvoorbeeld het geval bij een gevalideerde meetmethode. 250 keer? vette shit !! De formule wordt dan: Van een gevalideerde meetmethode is vastgesteld hoe nauwkeurig hij is. Dit doet Voorbeeld men een grootinaantal te en doen, De meetmethode van hetdoor suikergehalte cola ismetingen gevalideerd heeft net zoals wij bij de lengtemeting deden een (on)nauwkeurigheid van 2, 5 %. Dit mogen we zien als variatiecoëfficiënt van de populatie (alle mogelijke steekproeven). Gegeven n = 3 suikergehalte = 105 g/L • • Bereken de standaarddeviatie n Bereken het betrouwbaarheidsinterval BI 13

Betrouwbaarheidsinterval Hoe vinden we de standaardfout SE ? • Als we niets weten van

Betrouwbaarheidsinterval Hoe vinden we de standaardfout SE ? • Als we niets weten van de populatie kunnen we de standaardfout alleen maar berekenen met de standaarddeviatie van de steekproef. Helaas geldt deze formule alleen wanneer sprake is van een normaalverdeling en bij kleine steekproeven is dat niet het geval!! We kunnen de Z-waarden niet gebruiken. We moeten gebruik maken van de t-verdeling De vorm van de t-verdeling hangt af van het aantal samples in de steekproef. In dit geval geldt hij voor n = 5 ofwel v=n– 1=4 Alle andere waarden staan in de t-tabel. 14

Betrouwbaarheidsinterval De formule wordt dan: Voorbeeld suiker in cola Gegeven n = 5 suikergehalte

Betrouwbaarheidsinterval De formule wordt dan: Voorbeeld suiker in cola Gegeven n = 5 suikergehalte = 105 g/L en n-1 = 6 g/L We zagen in de grafiek dat t = 2, 78 bij 95 % betrouwbaarheid Afgerond suikergehalte 95 % Zonder 250 metingen te doen, kunnen we toch een 95 % betrouwbare uitslag doorgeven. Een betrouwbaarheid van 95 % betekent wel een onbetrouwbaarheid van 5 %. Dat houdt in dat we, wanneer we de steekproef 20 x zouden doen, we 1 van de 20 keer een verkeerde uitslag zouden kunnen doorgeven. In de wereld van wetenschap en laboratorium wordt dit geaccepteerd. 15

16

16