Funktion und Begriffe des Reinforcement Learning

Lothar Sebastian Krapp
Lothar Sebastian Krapp
Last updated 
Probiert folgendes Spiel aus und testet alle verschiedenen Optionen, die ihr darin habt:
https://imaginary.github.io/reinforcement-learning-2/exhibit.html?lang=en

Spielt auch einige Runden des Spiels Sumory:
https://imaginary.github.io/sumory/

Fragen:
  1. Versuche dem Roboter-Labyrinth-Spiele folgende Begriffe zuzuordnen:
    - Agent
    - Strategie (policy)
    - Belohnung / negative Belohnung
    - Umwelt (environment)
    - Zustand (state)
    - Aktion (action)
  2. Wie entscheidet der Agent, in welche Richtung er sich bewegt, wenn er auf einem bestimmten Feld steht?
  3. Wie passt der Agent seine Strategie an?
  4. Was ist die Strategie des Agenten, wenn er die Aufgabe "Explore" hat? Was ist seine Strategie bei "Exploit"?
  5. Versuche, das Explore-Exploit-Dilemma anhand von Sumory zu erklären.