Mestersges intelligencia 8 Stratgiai jtkok A jtk kimenetelre
- Slides: 17
Mesterséges intelligencia 8
Stratégiai játékok A játék kimenetelére a játékosoknak ellenőrizhető módon van befolyásuk. Pl. : sakk, dáma, póker stb. A világ idealizált modellje, melyben az ellenséges játékosok versengenek.
Stratégiai játékok l l l 1890 – sakk végjáték (király VS király+bástya) – elfogadható stratégia 1940 – Nimotron (Nim játék) – tökéletes stratégia 1944 – Neumann & Morgenstern: „Theory of Games and Economic Behavior” – minimax algoritmus 1951 –Turing sakkprogramja – gyenge 1956 – Mc. Carthy – alfabéta vágás
Játékok tulajdonságai l lehetséges állások l játékosok száma l szabályos lépések l mi a kezdőállás l mikor ér véget a játék és ki (mennyit) nyer l játékosok információi l van-e véletlennek szerepe
Játékok osztályozása l Játékosok száma szerint: kétszemélyes játékok l háromszemélyes játékok stb. l l Véges l sok lépés: véges játékok l Véletlen szerepe: determinisztikus játékok l sztochasztikus játékok l
Játékok osztályozása l. A játékosok az összes információval rendelkeznek: l teljes információjú játékok l Nyereségek+veszteségek=0 l zérusösszegű játékok Továbbiakban: kétszemélyes, véges, determinisztikus, teljes információjú, zérusösszegű játékokkal foglalkozunk.
Játékok reprezentációja
Játékok reprezentációja Meghatározandó minden operátorhoz: alkalmazási előfeltétel + alkalmazási függvény
Nim ln db. kupacban kavicsok l a játékosok egy kupacból akárhány kavicsot elvehetnek l az veszít, aki az utolsó kavicsot veszi el
Tic-tac-toe (3 x 3 -as amőba)
Állapottér-gráf → Játékfa l Állapottér-gráf fává egyenesítve: játékfa l Játszma: a gyökérből (kezdőállapot) valamely célállapotba (levélcsúcs) vezető út. l Stratégia: döntési terv, mely előírja a játékosnak, hogy adott állapotban milyen operátort alkalmazzon.
ÉS/VAGY gráf A játékos stratégiája
ÉS/VAGY gráf
Stratégia l Alakítsuk át a játékfát ÉS/VAGY gráffá a p játékos szemszögéből: A p lépéseit megadó élek → VAGY-élek l A p ellenfelének lépéseit egy-egy állapotból megadó élköteg → ÉS-élköteg l lp stratégiája: a kezdőállapotból kiinduló hiperút, melynek levelei a játékfának is levelei.
Nyerő stratégia l Ha az A játékos is és a B játékos is a saját stratégiájuk szerint játszanak, akkor a két stratégia egyértelműen meghatározza a játékmenetet. lp nyerő stratégiája: olyan stratégiája pnek, melynek (mint hiperútnak) a leveleiben csupa olyan célállapot van, melyben p nyer.
Nyerő stratégia Tétel: minden (általunk vizsgált) játék esetén valamelyik játékosnak van nyerő stratégiája. l. A játékfa levélelemeit címkézzük A-val, ill. B-vel attól függően, hogy A vagy B nyer-e az adott célállapotban.
Nyerő stratégia Tétel: minden (általunk vizsgált) játék esetén valamelyik játékosnak van nyerő stratégiája. l Szintenként alulról felfelé címkézünk: ha a csúcsban p lép és l l l van p címkéjű gyermeke p címkét kap egyébként az ellenfél címkéjét A gyökér (kezdőállapot) címkéje mutatja a nyerő stratégiájú játékost