Markov decision Processes with fractional costs

Zhiyuan Ren Zhiyuan Ren,B.H Krogh

doi:10.1109/tac.2005.846520

Markov decision Processes with fractional costs

Zhiyuan Ren Zhiyuan Ren, B.H Krogh

https://doi.org/10.1109/tac.2005.846520

Copy DOI

Journal: IRE Transactions on Automatic Control	Publication Date: May 1, 2005
Citations: 13

Affiliation: General Electric (United States), Embedded Systems (United States)

#Markov Decision Processes #Long-run Averages + Show 8 more

Abstract
Full-Text PDF
Similar Papers

Abstract

Certain methods for constructing embedded Markov decision processes (MDPs) lead to performance measures that are the ratio of two long-run averages. For such MDPs with finite state and action spaces and under an ergodicity assumption, this note presents algorithms for computing optimal policies based on policy iterations, linear programming, value iterations and Q-learning.

Full Text