Bias optimality for multichain continuous-time Markov decision processes

Xianping Guo,Xinyuan Song,Junyu Zhang

doi:10.1016/j.orl.2009.04.005

Bias optimality for multichain continuous-time Markov decision processes

Xianping Guo, Xinyuan Song + Show 1 more

https://doi.org/10.1016/j.orl.2009.04.005

Copy DOI

Journal: Operations Research Letters	Publication Date: May 22, 2009
Citations: 3

Affiliation: University of Hong Kong

#Continuous-time Markov Decision Processes #Finite Number Of Iterations + Show 8 more

Abstract
Full-Text PDF
Similar Papers

Abstract

This paper deals with the bias optimality of multichain models for finite continuous-time Markov decision processes. Based on new performance difference formulas developed here, we prove the convergence of a so-called bias-optimal policy iteration algorithm, which can be used to obtain bias-optimal policies in a finite number of iterations.

Full Text