RAUNALNIKO IGRANJE IGER S KARTAMI MITJA LUTREK IGRE

  • Slides: 10
Download presentation
RAČUNALNIŠKO IGRANJE IGER S KARTAMI MITJA LUŠTREK

RAČUNALNIŠKO IGRANJE IGER S KARTAMI MITJA LUŠTREK

IGRE S POPOLNO IN NEPOPOLNO INFORMACIJO n n Popolna informacija: ¨ šah, ¨ dama,

IGRE S POPOLNO IN NEPOPOLNO INFORMACIJO n n Popolna informacija: ¨ šah, ¨ dama, ¨ Othello, ¨ Scrabble, ¨ backgammon ¨. . . Nepopolna informacija: ¨ poker, ¨ bridž, ¨ tarok ¨. . .

CILJI DIPLOMSKE NALOGE n n n Narediti pregled literature o računalniškem igranju iger s

CILJI DIPLOMSKE NALOGE n n n Narediti pregled literature o računalniškem igranju iger s kartami. ¨ Izkazalo se je, da je prav veliko ni. Ugotovitve uporabiti za izdelavo programa za igranje taroka. ¨ Sprogramiral sem Silicijastega tarokista. Program ustrezno ovrednotiti. ¨ Preizkuševalci so poročali, da solidno tarokira. ¨ Na voljo je na internetu in čas bo pokazal, ali javnost mara zanj: http: //tarok. bocosoft. com.

DREVO IGRE IN MINIMAKS n Predstavitev igranja z drevesom igre in preiskovanje drevesa z

DREVO IGRE IN MINIMAKS n Predstavitev igranja z drevesom igre in preiskovanje drevesa z izpeljanko algoritma minimaks sta običajna pri igrah s popolno informacijo.

VZORČENJE MONTE CARLO n Preiskovanje drevesa igre se da uporabiti tudi pri igrah z

VZORČENJE MONTE CARLO n Preiskovanje drevesa igre se da uporabiti tudi pri igrah z nepopolno informacijo.

BOLJŠI PREISKOVALNI ALGORITMI n n Alfa-beta je izpeljanka minimaksa. Uporablja okno (α, β), ki

BOLJŠI PREISKOVALNI ALGORITMI n n Alfa-beta je izpeljanka minimaksa. Uporablja okno (α, β), ki omejuje trenutno pričakovani rezultat. Obstajajo nadaljnje izboljšave: ¨ transpozicijska tabela, ¨ particijsko iskanje (program za igranje bridža GIB – M. L. Ginsberg, 1996), ¨ razvrščanje potez, ¨ prilagajanje širine iskalnega okna, ¨ prilagajanje globine iskanja.

TRANSPOZICIJSKA TABELA n n n Običajno: v tabelo se shranjujejo stanja igre in njihove

TRANSPOZICIJSKA TABELA n n n Običajno: v tabelo se shranjujejo stanja igre in njihove vrednosti. Particijsko iskanje: za vsako vozlišče se izračuna množica vozlišč z enako vrednostjo, ki se skupaj s to vrednostjo shrani v tabelo. Silicijasti tarokist: množica enakovrednih vozlišč se določi hevristično.

DRUGE IZBOLJŠAVE ISKANJA n n n Razvrščanje potez: ¨ dobro je najprej preizkusiti potezo,

DRUGE IZBOLJŠAVE ISKANJA n n n Razvrščanje potez: ¨ dobro je najprej preizkusiti potezo, zaradi katere se preiskovanje v nekem vozlišču prekine; ¨ zgodovinska hevristika: prednost dajem kartam, ki so v preteklosti povzročale prekinitve preiskovanja. Prilagajanje širine iskalnega okna: ¨ če je iskalno okno manjše, je preiskovanje hitrejše; ¨ iskanje z najmanjšim oknom: za neprve naslednike vozlišča je okno najmanjše možno, ker skušam le pokazati, da so slabši od prvega. Prilagajanje globine iskanja: ¨ manj zanimive veje je smotrno preiskati plitveje; ¨ s človeškim znanjem izločam nekatere poteze.

IZBOLJŠAVE VZORČENJA MONTE CARLO n n Znano je, da ima vzorčenje Monte Carlo pomanjkljivosti.

IZBOLJŠAVE VZORČENJA MONTE CARLO n n Znano je, da ima vzorčenje Monte Carlo pomanjkljivosti. Za nekatere obstajajo bolj ali manj dobre rešitve. Pomanjkljivost, ki sem jo opazil sam: ¨ postavi predpostavko o stanju igre; ¨ zaporedje slaba, a neizogibna poteza – dobra poteza je ocenjeno enako kot dobra poteza – slaba, a neizogibna poteza; ¨ včasih zato najprej naredi slabo, a neizogibno potezo; ¨ zatem se izkaže, da ni bila neizogibna. Moja rešitev: poleg iskanja do polne globine se opravi še iskanje do globine enega vzetka. To daje prednost takojšnjemu dobičku. Uporabi se kombinacija rezultatov obeh iskanj.

REZULTATI n n Moj preiskovalni algoritem pri isti globini razvije 184 -krat manj vozlišč

REZULTATI n n Moj preiskovalni algoritem pri isti globini razvije 184 -krat manj vozlišč kot alfa-beta in za to porabi 86 -krat manj časa. Po preizkušanju z dvojico dobrih tarokistov smo ugotovili, da program sicer občasno dela napake, a je dovolj dober, da je igra proti njemu zanimiva.