Probiert folgendes Spiel aus und testet alle verschiedenen Optionen, die ihr darin habt:
https://imaginary.github.io/reinforcement-learning-2/exhibit.html?lang=en
Spielt auch einige Runden des Spiels Sumory:
https://imaginary.github.io/sumory/
Fragen:
https://imaginary.github.io/reinforcement-learning-2/exhibit.html?lang=en
Spielt auch einige Runden des Spiels Sumory:
https://imaginary.github.io/sumory/
Fragen:
- Versuche dem Roboter-Labyrinth-Spiele folgende Begriffe zuzuordnen:
- Agent
- Strategie (policy)
- Belohnung / negative Belohnung
- Umwelt (environment)
- Zustand (state)
- Aktion (action) - Wie entscheidet der Agent, in welche Richtung er sich bewegt, wenn er auf einem bestimmten Feld steht?
- Wie passt der Agent seine Strategie an?
- Was ist die Strategie des Agenten, wenn er die Aufgabe "Explore" hat? Was ist seine Strategie bei "Exploit"?
- Versuche, das Explore-Exploit-Dilemma anhand von Sumory zu erklären.