A Multi-Step Reinforcement Learning Algorithm

Zhi Cong Zhang,Kai Shun Hu,Hui Yu Huang,Shuai Li,Shao Yong Zhao

doi:10.4028/www.scientific.net/amm.44-47.3611

A Multi-Step Reinforcement Learning Algorithm

Zhi Cong Zhang, Kai Shun Hu + Show 3 more

https://doi.org/10.4028/www.scientific.net/amm.44-47.3611

Copy DOI

Journal: Applied Mechanics and Materials	Publication Date: Dec 6, 2010
Citations: 1

Affiliation: Dongguan University of Technology

#Semi-Markov Decision Process #Off-line Updating + Show 8 more

Abstract
Full-Text PDF
Similar Papers

Abstract

Reinforcement learning (RL) is a state or action value based machine learning method which approximately solves large-scale Markov Decision Process (MDP) or Semi-Markov Decision Process (SMDP). A multi-step RL algorithm called Sarsa(,k) is proposed, which is a compromised variation of Sarsa and Sarsa(). It is equivalent to Sarsa if k is 1 and is equivalent to Sarsa() if k is infinite. Sarsa(,k) adjust its performance by setting k value. Two forms of Sarsa(,k), forward view Sarsa(,k) and backward view Sarsa(,k), are constructed and proved equivalent in off-line updating.

Full Text