Institute of Information Theory and Automation

You are here

Bibliography

Conference Paper (international conference)

On the set of optimal policies in variance penalized Markov decision chains

Sladký Karel, Sitař Milan

: Operations Research Proceedings 2003, p. 395-402

: OR 2003. International Conference on Operations Research, (Heidelberg, DE, 03.09.2003-05.09.2003)

: CEZ:AV0Z1075907

: GA402/02/1015, GA ČR, GA402/01/0539, GA ČR

: Markov decision chains, mean-variance optimality, policy iterations

(eng): In this note we present a policy iteration algorithm for constructing a set of efficient stationary policies containing optimal policies with respect to various criteria used for the mean variance tradeoff. This algorithm works both for the unichain and multichain models. We show that the obtained policies are optimal also in the class of Markovian (memoryless) policies.

(cze): V práci je navržen algoritmický postup, založený na iteracích v prostoru stacionárních řízení, pro nalezení eficientních stacionárních řízení s ohledem na různá kritéria optimality typu průměrný výnos a jeho rozptyl. Navržený algoritmický postup je možno využít i pro případ markovských řetězců s větším počtem tříd rekurentních stavů. Je rovněž ukázáno, že takto nalezená řízení jsou optimální i ve třídě všech markovských řízení

: 12B

: BB

2019-01-07 08:39