Filtry
  • Kolekcje
  • Publikacje grupowe
  • Typ pliku
  • Autor
  • Współtwórca
  • Tytuł
  • Temat i słowa kluczowe
  • Data wydania
  • Typ zasobu
  • Jezyk
  • Prawa do dysponowania publikacją

Szukana fraza: [Abstract = "In this article, a new class of the epoch\-incremental reinforcement learning algorithm is proposed. In the incremental mode, the fundamental TD\(0\) or TD\(\[lambda\]\) algorithm is performed and an environment model is created. In the epoch mode, on the basis of the environment model, the distances of past\-active states to the terminal state are computed. These distances and the reinforcement terminal state signal are used to improve the agent policy."]

Wyników: 1

obiektów na stronie

Ta strona wykorzystuje pliki 'cookies'. Więcej informacji