Ehdollisten todennkisyyksien mrittminen Topi Tahvonen S ysteemianalyysin Laboratorio
Ehdollisten todennäköisyyksien määrittäminen Topi Tahvonen S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 1
Ehdolliset todennäköisyydet • Erilaisia lähtökohtia ehdollisille todennäköisyyksille: – frekvenssit tilastoista – subjektiiviset todennäköisyydet • Laskuesimerkkejä: – Maitotesti – Hevosfarmi – Kolmen kortin pokeri S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 2
Maitotesti • Mallia varten tarvitaan todennäköisyydet P(Inf) ja P(Testi | Inf) • Testin toimittaja antaa testiä kuvaavat arvot: – Väärät positiiviset: P(Test = pos | Inf = ei) = 0. 01 – Väärät negatiiviset: P(Test = neg | Inf = kyllä) = 0. 01 • P(Inf) = λ lasketaan tilastoista: Navetassa 50 lehmää, jotka lypsetään joka päivä. Lypsetty maito kaadetaan samaan säiliöön ja yhtenä päivänä kuukaudesta maito ei läpäise meijerin tarkkaa testiä. S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 3
Jos testitulos on positiivinen, millä todennäköisyydellä lehmä on saanut infektion? • Lasketaan yhteisjakauma Bayes-verkon ketjusäännöllä = Inf = kyllä Inf = ei 0. 0007 0. 9993 = . Inf = kyllä Inf = ei Testi = pos 0. 99 0. 01 Testi = neg 0. 01 0. 99 Inf = kyllä Inf = ei Testi = pos 0. 000693 0. 009993 Testi = neg 0. 000007 0. 989307 S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 4
Nyt voidaan laskea ehdollinen todennäköisyys: S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 5
Seitsemän päivän malli • Mallia varten oletetaan todennäköisyys saada infektio 0. 0002 Infi = kyllä Infi = ei Infi+1 = kyllä 0. 7 0. 0002 Infi+1 = ei 0. 3 0. 9998 S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 6
Seitsemän päivän malli kahden päivän muistilla • Oletetaan, että infektio kestää ainakin kaksi päivää, jonka jälk Infi-1 = kyllä Infi-1 = ei Infi = kyllä 0. 6 1 Infi = ei 0. 0002 S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 7
• Mallissa huomioidaan myös testin oikeellisuuden muisti; jos testi oli oikein eilen, se on suurella todennäköisyydellä oikein myös tänään Oikeini= kyllä Oikeini = ei Infi = kyllä 0. 999 0. 1 Infi = ei 0. 001 0. 9 • Käytetään välittäviä muuttujia Oikeini, jotta ehdolliset todennäköisyydet saadaan yksinkertaisemmiksi Infi = kyllä Infi = ei Testii = pos 1 0 Testii = neg 0 1 S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 8
Hevossiittola • Selviää, että Johnilla on vakava perinnöllinen sairaus ja se joudutaan lopettamaan. Sairausgeeni halutaan pois tuotannosta. Mitä hevosia voi käyttää tuotannossa edelleen? S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 9
• Sairautta koskevat geenit voivat olla (aa) sairas, (a. A) kantaja aa a. A AA aa (1, 0, 0) (0. 5, 0) (0, 1, 0) a. A (0. 5, 0) (0. 25, 0. 25) (0, 0. 5) AA (0, 1, 0) (0, 0. 5) (0, 0, 1) • Johnia lukuun ottamatta kaikki hevoset ovat terveitä a. A AA a. A (0. 25, 0. 25) (0, 0. 5) AA (0, 0. 5) (0, 0, 1) S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 10
• Geeniyhdistelmää (aa) ei ole, jos hevonen on terve a. A AA a. A (0. 67, 0. 33) (0, 0. 5) AA (0, 0. 5) (0, 0, 1) • Johnista on evidenssi (aa) • Oletetaan, että hevosilla on 0. 01 todennäköisyys kantaa sairausgeeniä eli (a. A) • Näistä todennäköisyys taulukoista ja geenin kantamisen prioritodennäköisyydestä voidaan muodostaa Bayes-verkkon mukainen malli, jonka avulla voidaan laskea todennäköisyydet sairausgeenille koko sukupuussa S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 11
Johnin sukupuu S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 12
Todennäköisyydet kantaa sairausgeeniä ilman evidenssiä S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 13
Todennäköisyydet kantaa sairausgeeniä, kun Johnista on evidenssi (aa) S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 14
Kolmen kortin pokeri • Pelaajilla kolme korttia • Kaksi vaihtovuoroa, toisessa vaihdossa voi vaihtaa maksimissaan kaksi korttia • Käsien arvojärjestys: ei mitään (no), ässä (1 a), pari (2 v), ässäpari (2 a), väri (fl), suora (st), kolmoset (3 v), värisuora (sfl) S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 15
Pokeripelin Bayes-verkko • OH 0, vastustajan ensimmäinen käsi • FC, ensimmäinen vaihto • OH 1, vastustajan toinen käsi • SC, toinen vaihto • OH 2, vastustajan lopullinen käsi • MH, pelaajan oma käsi • Besthand, parempi käsi S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 16
Ehdolliset todennäköisyydet pokerissa • Ihmiset pelaavat eri tavalla, joten ei voida antaa todennäköisyyksiä, jotka ovat valideja kaikille • Oletetaan yksinkertainen strategia vaihdoille S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 17
1. Vaihdon strategia • Jos ei ole mitään (no), vaihda kaikki • Jos on ässä (1 a), vaihda kaksi • Jos on kaksi peräkkäistä arvoa (2 cons), kaksi samaa maata (2 s) tai pari (2 v), vaihda yksi – jos on kaksi peräkkäistä ja kaksi samaa maata, pidetään kaksi samaa maata – jos mahdollisuus suoraan tai väriin ja pari, pidetään pari • Jos on väri (fl), suora (st), kolmoset (3 v) tai värisuora (sfl), ei vaihdeta mitään S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 18
• Mahdolliset tilat ovat (no, 1 a, 2 cons, 2 v, fl, st, 3 v, sfl), joiden todennäköisyydet ensimmäisessä jaossa ovat P(OH 0) = (0. 1672, 0. 0445, 0. 0635, 0. 4659, 0. 1694, 0. 0494, 0. 0353, 0. 0024) P(OH 1 | OH 0, FC): S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 19
2. Vaihdon strategia • Toiselle vaihdolle käytetään samaa strategiaa paitsi, jos ei ole • Nyt ollaan kiinnostuneista vain pokerikäsistä, joilla on arvoa, S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 20
P(OH 2 | OH 1, Sc): • Kun näitä ehdollisten todennäköisyyksien taulukoita käytetään pokerin Bayes-verkossa, voidaan tehdä malli, jota kokematon pokerin pelaaja voi käyttää apunaan. • Heikkouksia: Vastapelaaja voi tietää, että pelaaja käyttää tätä mallia. Tällöin hän voi esim. vaihtaa kaksi ensimmäisellä kierroksella, vaikkei hänellä olisikaan ässää. Täten malli ei arvosta omaa kättä riittävästi. S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 21
Yhteenveto • Bayes-verkkoilla laskemista varten pitää tietää prioritodennäköisyyksiä ja ehdollisia todennäköisyyksiä solmuille, joilla on vanhempia • Bayes-verkon yhteisjakauma määritetään ketjutussäännöllä • Yhteisjakaumasta voidaan laskea muut todennäköisyydet S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 22
Kotitehtävä a) Toteuta sivun 7 mukainen malli maitotestistä Huginilla. Ovatko prioritodennäköisyydet stabiileja ajan yli? b) Tarkastellaan ehdollista todennäköisyyttä P(Inf 2 | Inf 1), kun P(Inf 1) = (0. 0007, 0. 9993) ja infektion saamisen todennäköisyys on 0. 0002. Vaaditaan stabiili prioritodennäköisyys: P(Inf 1) = P(Inf 2) = (0. 0007, 0. 9993). Osoita, että parantumisen todennäköisyyden on oltava n. 2/7. S ysteemianalyysin Laboratorio Teknillinen korkeakoulu Esitelmä 4 – Topi Tahvonen Optimointiopin seminaari - Syksy 2005 / 23
- Slides: 23