Mestersges intelligencia 8 Stratgiai jtkok A jtk kimenetelre

  • Slides: 17
Download presentation
Mesterséges intelligencia 8

Mesterséges intelligencia 8

Stratégiai játékok A játék kimenetelére a játékosoknak ellenőrizhető módon van befolyásuk. Pl. : sakk,

Stratégiai játékok A játék kimenetelére a játékosoknak ellenőrizhető módon van befolyásuk. Pl. : sakk, dáma, póker stb. A világ idealizált modellje, melyben az ellenséges játékosok versengenek.

Stratégiai játékok l l l 1890 – sakk végjáték (király VS király+bástya) – elfogadható

Stratégiai játékok l l l 1890 – sakk végjáték (király VS király+bástya) – elfogadható stratégia 1940 – Nimotron (Nim játék) – tökéletes stratégia 1944 – Neumann & Morgenstern: „Theory of Games and Economic Behavior” – minimax algoritmus 1951 –Turing sakkprogramja – gyenge 1956 – Mc. Carthy – alfabéta vágás

Játékok tulajdonságai l lehetséges állások l játékosok száma l szabályos lépések l mi a

Játékok tulajdonságai l lehetséges állások l játékosok száma l szabályos lépések l mi a kezdőállás l mikor ér véget a játék és ki (mennyit) nyer l játékosok információi l van-e véletlennek szerepe

Játékok osztályozása l Játékosok száma szerint: kétszemélyes játékok l háromszemélyes játékok stb. l l

Játékok osztályozása l Játékosok száma szerint: kétszemélyes játékok l háromszemélyes játékok stb. l l Véges l sok lépés: véges játékok l Véletlen szerepe: determinisztikus játékok l sztochasztikus játékok l

Játékok osztályozása l. A játékosok az összes információval rendelkeznek: l teljes információjú játékok l

Játékok osztályozása l. A játékosok az összes információval rendelkeznek: l teljes információjú játékok l Nyereségek+veszteségek=0 l zérusösszegű játékok Továbbiakban: kétszemélyes, véges, determinisztikus, teljes információjú, zérusösszegű játékokkal foglalkozunk.

Játékok reprezentációja

Játékok reprezentációja

Játékok reprezentációja Meghatározandó minden operátorhoz: alkalmazási előfeltétel + alkalmazási függvény

Játékok reprezentációja Meghatározandó minden operátorhoz: alkalmazási előfeltétel + alkalmazási függvény

Nim ln db. kupacban kavicsok l a játékosok egy kupacból akárhány kavicsot elvehetnek l

Nim ln db. kupacban kavicsok l a játékosok egy kupacból akárhány kavicsot elvehetnek l az veszít, aki az utolsó kavicsot veszi el

Tic-tac-toe (3 x 3 -as amőba)

Tic-tac-toe (3 x 3 -as amőba)

Állapottér-gráf → Játékfa l Állapottér-gráf fává egyenesítve: játékfa l Játszma: a gyökérből (kezdőállapot) valamely

Állapottér-gráf → Játékfa l Állapottér-gráf fává egyenesítve: játékfa l Játszma: a gyökérből (kezdőállapot) valamely célállapotba (levélcsúcs) vezető út. l Stratégia: döntési terv, mely előírja a játékosnak, hogy adott állapotban milyen operátort alkalmazzon.

ÉS/VAGY gráf A játékos stratégiája

ÉS/VAGY gráf A játékos stratégiája

ÉS/VAGY gráf

ÉS/VAGY gráf

Stratégia l Alakítsuk át a játékfát ÉS/VAGY gráffá a p játékos szemszögéből: A p

Stratégia l Alakítsuk át a játékfát ÉS/VAGY gráffá a p játékos szemszögéből: A p lépéseit megadó élek → VAGY-élek l A p ellenfelének lépéseit egy-egy állapotból megadó élköteg → ÉS-élköteg l lp stratégiája: a kezdőállapotból kiinduló hiperút, melynek levelei a játékfának is levelei.

Nyerő stratégia l Ha az A játékos is és a B játékos is a

Nyerő stratégia l Ha az A játékos is és a B játékos is a saját stratégiájuk szerint játszanak, akkor a két stratégia egyértelműen meghatározza a játékmenetet. lp nyerő stratégiája: olyan stratégiája pnek, melynek (mint hiperútnak) a leveleiben csupa olyan célállapot van, melyben p nyer.

Nyerő stratégia Tétel: minden (általunk vizsgált) játék esetén valamelyik játékosnak van nyerő stratégiája. l.

Nyerő stratégia Tétel: minden (általunk vizsgált) játék esetén valamelyik játékosnak van nyerő stratégiája. l. A játékfa levélelemeit címkézzük A-val, ill. B-vel attól függően, hogy A vagy B nyer-e az adott célállapotban.

Nyerő stratégia Tétel: minden (általunk vizsgált) játék esetén valamelyik játékosnak van nyerő stratégiája. l

Nyerő stratégia Tétel: minden (általunk vizsgált) játék esetén valamelyik játékosnak van nyerő stratégiája. l Szintenként alulról felfelé címkézünk: ha a csúcsban p lép és l l l van p címkéjű gyermeke p címkét kap egyébként az ellenfél címkéjét A gyökér (kezdőállapot) címkéje mutatja a nyerő stratégiájú játékost