Tip:
Highlight text to annotate it
X
Nem árt tisztázni néhány alap kifejezést,
amit gyakran használnak a mesterséges intelligencia területen a különböző tipusú problémák megkülönböztetésére.
Első kifejezés, amit megtanítok neked, az a teljes versus részleges megfigyelhetőség.
Teljesen megfigyelhető környezetnek nevezzük azt, amit az ügynök észlelni tud
bármikor és az teljesen elégséges optimális döntéshez.
Például, sok kártyajátékban,
amikor minden kártya az asztalon van, az összes kártya pillanatnyi látványa
valóban elégséges az optimális döntéshez.
Ez különbözik más környezetektől, ahol az ügynök memóriájára is
szükség van a lehető legjobb döntéshez.
Például a pókerben a kártyák nincsenek nyílt lapként az asztalon,
így a múltbeli lap mozgások megjegyzése fejben segít jobb döntést hozni.
A különbség teljes megértéséhez, képzeljünk el egy ügynök kölcsönhatását
a környezettel annak észlelői és mozgatókarja segítségével,
és ez a kölcsönhatás több cikluson keresztül tart,
ezt gyakran észlelés-cselekvés ciklusnak nevezik.
Különböző környezetekben, lehetséges feltételezni,
hogy a környezet egyfajta belső állapottal rendelkezik.
Például az olyan kártyajátékban, ahol az asztalon fekvő kártyák hátoldala látszik csak,
az állapot csak a kézben tartott lapokra vonatkozik.
Egy környezet teljesen megfigyelhető, ha az érzékelők mindig láthatják
a környezet teljes állapotát.
Részlegesesen megfigyelhető, ha az érzékelők az állapotnak csak egy részét látják,
míg a múltbeli mérések megjegyzése olyan további állapot információt szolgáltatnak,
amelyeket már nem tudunk megfigyelni.
Tehát bármilyen játék, ahol például a múltbeli lépésekből információ nyerhető arról,
hogy mi van egy játékos kezében, ezek a játékok részlegesen megfigyelőek,
és más módon szükséges kezelni azokat.
Nagyon gyakran, a részlegesen megfigyelhető környezetben működő ügynököknek
belső memóriával kell rendelkezniuk ahhoz, hogy megértsék
a környezet állapotát, erről részletesen fogunk beszélni,
amikor a rejtett Markov modellről és ezen struktúra
belső memóriájáról fogunk beszélni.
Egy második környezeti kifejezés arra vonatkozik, hogy a környezet
determinisztikus vagy sztochasztikus.
A determinisztikus környezet olyan, ahol az ügynök cselekedetei
egyedileg határozzák meg a kimenetelt.
Így, például, a sakkban tényleg nincs véletlenszerűség akkor, amikor lépsz egy bábúval.
A bábuval történő lépés hatása teljesen előre meghatározott,
és nem számít, hogy hova fogok lépni ugyanazzal a bábuval, a kimenetel ugyanaz.
Ezt nevezzük determinisztikusnak
A kockajátékok, például, mint a backgammon, sztochasztikusak.
Ugyanúgy determinisztikusan léphetsz a bábúddal,
a lépés kimenetele mégis tartalmazza a kocka eldobását.
és azt nem tudod előre megmondani.
Bizonyos nagyságú véletlent tartalmaz a kockadobás kimenetele,
és ezért nevezzük ezt sztochasztikusnak.
Belszéljünk a diszkrét versus folytonos fogalmakról.
Diszkrét környezet az, ahol véges számú lehetőségből választhatsz,
és véges számú dolgot tudsz észlelni.
Így, például, a sakkban, ismét, véges számú tábla pozíció lehetséges,
és véges számú dolgot tehetsz.
Ez különbözik a folytonos környezettől,
ahol a lehetséges cselekedetek tere, vagy az észlelhető dolgok száma végtelen.
Így, például, ha dartsozol, végtelen számú szögben dobhatod el
és gyorsíthatod fel őket.
Végezetül, megkülönböztetünk