Kap 00 Innledning 1 Hva er statistikk I



























- Slides: 27
Kap 00 Innledning 1
Hva er statistikk? I ä Statistikk er avledet av det latinske ”status” og betydde opprinnelig beskrivelse av stats- og samfunnsforhold. 2
Hva er statistikk? II Systematisk innsamling av data med oppstilling i tabeller. Vitenskapen om belysningen av visse masseforeteelser i samfunnet bygd på tallmessige oppgaver. I statistikk studeres forsøk og fenomen der tilfeldigheter har innvirkning på resultatet. En utvikler og gjør bruk av matematisk baserte metoder til å få frem viten og om mulig trekke konklusjoner på grunnlag av resultatene. Vitenskapen som søker å foreslå og eventuelt etablere prinsipper og metoder som kan være til hjelp når en skal treffe beslutninger under usikkerhet. 3
Hovedområder innen statistikk - Forsøksplanlegging / Datainnsamling - Beskrivende statistikk - Sannsynlighetsregning m/kombinatorikk, sannsynlighetsmodeller - Statistisk inferens 4
Inndata - Databehandling - Tolkning Innsamling av data/informasjon Databehandling Tolking av data Konsekvenser 5
Viktig med ”gode” inndata Databehandling SISU = Søppel Inn Søppel Ut 6
Historie 1564 1657 1654 1713 1810 1880 1933 1940 ’The Book on Games of Chance’ ’Calculations in Games of Chance’ Sannsynlighetsbegrepet ’Kunsten å gjette’ Estimeringsteori Hypotesetesting Hypotesetesing Aksiomatisk grunnlag Statistisk forsøksplanlegging Statistisk desisjonsteori Pascal: Cardano Huygens Fermat / Pascal Bernoulli Laplace/Gauss Galton/Pearson Neyman/Pearson Kolmogorov Fisher Wald Hvor mange kast må en gjøre med to terninger for at sjansen for å få to seksere skal bli større enn sjansen for ikke å få det. Rettferdig fordeling av potten i et spill som blir avbrutt før det er ferdigspilt. 7
Statistikk - Eksempel - Trafikkulykker I 1981 ble det drept 338 mennesker på norske veier. Året etter var antall drepte hele 401 mennesker. Spørsmål: Er den observerte økningen som her var på hele 19% en tilfeldig endring, eller er den et uttrykk for at det begynner å bli farligere å ferdes på veiene? 8
Statistikk - Eksempel - Komponenter Vi tenker oss et viktig system (innen medisin, fly, …) Spørsmål: Med hvor stor sikkerhet kan vi si at dette systemet vil virke når vi kjenner sikkerheten til de enkelte komponentene? Hvordan skal vi sammensette dette systemet for at vi med en gitt sikkerhet kan si at det vil fungere? 9
Statistikk - Eksempel - Medisin I En ny medisintype skal utprøves. Spørsmål: Hvordan skal vi ordne oss for å finne ut om denne nye medisinen er mer virkningsfull en tidligere medisiner? Med hvor stor sikkerhet kan vi si at den nye medisinen er bedre? Hva med eventuelle bivirkninger? 10
Statistikk - Eksempel - Medisin II Medfødte misdannelser: Hvordan finne eventuell årsak? Akutt-innleggelse: Kan det være hjerteinfarkt, … ? 11
Statistikk - Eksempel - Stikkprøver Hvordan kan vi vha stikkprøver kunne forutsi noe om helheten? Eks: Gallup, kvalitetskontroll, risikoanalyse, . . . 12
Statistikk - Eksempel - Fraktaler Naturen (inkludert levende liv) har en tendends til å gjenta seg selv. Stikkord: Fraktaler log Deterministisk log L Naturen oppfører seg ikke deterministisk, men randomisert. Samme resultat som ovenfor, men nå med som statistisk middel. 13
Statistikk - Eksempel - Kaos Deler av naturen har en tendends til å være uforutsigbar. Stikkord: Kaos Sannsynlighetsteori benyttes til beskrivelse av slike fenomener. Tilstand 2 a Tilstand 1 Tilstand 2 b 14
Statistikk - Eksempel - Kvantefysikk I Mikrokosmos kan ikke beskrives vha våre naturlover i makrokosmos. Stikkord: Kvantefysikk er en sannsynlighetsfunksjon. Informasjon inn/ut endrer mikrokosmostilstand Mikrokosmos Informasjon ut 15
Statistikk - Eksempel - Kvantefysikk II Atom -partikkel Bil / Bakke Person / Vegg 16
Statistikk - Nødv. Aksiomer/Teoremer Bertrands skuffeparadoks Tre like skuffer har hver to rom. Den første skuffen inneholder to gullmynter, den andre en gullmynt og en sølvmynt og den tredje to sølvmynter. En skuff velges tilfeldig. Hva er sannsynligheten for at den inneholder to ulike mynter? Svar: 1/3. En skuff velges tilfeldig, ett av rommene inneholder en gullmynt. Hva er sannsynligheten for at skuffen inneholder to ulike mynter? En fristes lett til å tro at nå er det bare to muligheter og at sannsynligheten for å finne en sølvmynt i det andre rommet er 1/2. Det korrekte svaret er fortsatt 1/3 og det skyldes at når det registreres en gullmynt i ett av rommene, så er sannsynligheten for at skuff nr 1 er valgt dobbelt så stor som for skuff nr 2. G G 1 G S 2 S S 3 Det er lett å la seg lure av intuisjon, særlig til å tro at utfall er like sannsynlige. 17
Modell-tenking I En aktivitet som kan lede til en iakttagelse (et utfall) kaller vi et eksperiment. Vår erkjennelse kan utvikle seg ved å konstruere og analysere modeller for eksperimenter. 18
Modell-tenking II En modell er en abstraksjon, en formell representasjon av forestillinger vi har om et eksperiment. Virkelighet Modell Forestillingene blir uttrykt ved et antall forutsetninger om de grunnleggende trekk ved eksperimentet, og de ’lover’ som styrer det. Forutsetningene blir ofte uttrykt i matematiske termer. 19
Modell-tenking III En modell kan skape orden i tenkingen. Målet er å skape et forenklet bilde av en reell situasjon, men slik at bildet gir oss ny ’korrekt’ informasjon. Modelltenking tillater ulike syn. Innbyr til diskusjon om forutsetninger. Konstruksjon av alternative/bedre modeller. Ved å basere våre resonnementer på en modell, kan vi undersøke de logiske konsekvensene av våre forutsetninger, sammenholde disse med nye observasjoner og eventuelt modifisere/forkaste modellen. 20
Hva er en god modell? En god modell må være i stand til å hjelpe oss til å: - Finne sammenhenger som vi tidligere ikke så - Relatere virkninger og årsaker - Erstatte uvitenhet og vilkårlighet med innsikt og styring 21
Realisme - Modell - Enkelhet Siden vår verden er kompleks, vil enkelhet og grad av realisme av en modell vanligvis være krav som trekker i hver sin retning. Realisme Brukbar modell Enkelhet 22
Hovedtyper av modeller - Deterministisk modell Utfall entydig bestemt utfra ekperimentbetingelser - Stokastisk modell Utfall knyttet til usikkerhet og sannsynligheter 23
Statistikk og tilfeldighet I Hvordan kan statistikk som er basert på ’tilfeldigheter’ gi oss opplysninger som er relativt sikre? 24
Statistikk og tilfeldighet II Hvordan kan en eier av en skoforretning planlegge innkjøp av sko? Hvorfor kommer ikke alle kunder og handler sko på samme dag? Hva angår sykdommer vet vi at visse grupper mennesker er mer utsatt enn andre. Likevel vil det være store innslag av tilfeldigheter når det gjelder hvem som faktisk blir rammet. Ordet ’tilfeldig’ må her sees i forhold til den kunnskapen man har. 25
Sannsynlighet - De store talls lov: Når et stort antall tilfeldigheter sees under ett, så forsvinner på et vis det tilfeldige og erstattes av en nær deterministisk lovmessighet. 26
END 27