Funktion und Begriffe des Reinforcement Learning

Lothar Sebastian Krapp Last updated April 11, 2023 12:01pm

Probiert folgendes Spiel aus und testet alle verschiedenen Optionen, die ihr darin habt:
https://imaginary.github.io/reinforcement-learning-2/exhibit.html?lang=en

Spielt auch einige Runden des Spiels Sumory:
https://imaginary.github.io/sumory/

Fragen:

Versuche dem Roboter-Labyrinth-Spiele folgende Begriffe zuzuordnen:
- Agent
- Strategie (policy)
- Belohnung / negative Belohnung
- Umwelt (environment)
- Zustand (state)
- Aktion (action)
Wie entscheidet der Agent, in welche Richtung er sich bewegt, wenn er auf einem bestimmten Feld steht?
Wie passt der Agent seine Strategie an?
Was ist die Strategie des Agenten, wenn er die Aufgabe "Explore" hat? Was ist seine Strategie bei "Exploit"?
Versuche, das Explore-Exploit-Dilemma anhand von Sumory zu erklären.