Approximate dynamic programming by minimizing distributionally robust bounds

La programacin̤ dinm̀ica aproximada (ADP) es un enfoque popular para resolver problemas extensos de decisin̤ markovianos. En este documento se describe un nuevo tipo de mťodos de tal enfoque programacin̤ dinm̀ica aproximada distribuidamente robusta que aborda el curso de la dimensionalidad al minim...

Volledige beschrijving

Bewaard in:
Bibliografische gegevens
Andere auteurs: Petrik Marek, International Conference on Machine Learning (ICML)
Formaat: Boek
Taal:Engels
Onderwerpen:
Online toegang:Approximate dynamic programming by minimizing distributionally robust bounds
Tags: Voeg label toe
Geen labels, Wees de eerste die dit record labelt!