Optimal threshold probability and expectation in semi-Markov decision processes

Masahiko Sakaguchi,Yoshio Ohtsubo

doi:10.1016/j.amc.2010.04.007

Optimal threshold probability and expectation in semi-Markov decision processes

Masahiko Sakaguchi, Yoshio Ohtsubo

https://doi.org/10.1016/j.amc.2010.04.007

Copy DOI

Journal: Applied Mathematics and Computation	Publication Date: Apr 14, 2010
Citations: 7

Affiliation: Kōchi University

#Policy Improvement Method #Threshold Probability + Show 8 more

Abstract
Full-Text PDF
Similar Papers

Abstract

We consider undiscounted semi-Markov decision process with a target set and our main concern is a problem minimizing threshold probability. We formulate the problem as an infinite horizon case with a recurrent class. We show that an optimal value function is a unique solution to an optimality equation and there exists a stationary optimal policy. Also several value iteration methods and a policy improvement method are given in our model. Furthermore, we investigate a relationship between threshold probabilities and expectations for total rewards.

Full Text